Comments 31
«Standard steel helmets were painted matt greenish-grey. -> Шлемы из стандартной стали были окрашены в матово-зеленовато-серый»
Я думаю, всё же, «Стандартные стальные шлемы..». Раз уж по лингвистике статья…
Я думаю, всё же, «Стандартные стальные шлемы..». Раз уж по лингвистике статья…
UFO just landed and posted this here
Отвечу как редактор :)
Сталь может быть стандартной. При «стали» в такой конструкции может быть модификатор, указывающий на определенный тип стали (например, «wootz steel sword» или «damascus steel knife»).
Не зная предметной области трудно сказать, как правильно.
Но в этом примере хотели показать семантику слова «painted».
Сталь может быть стандартной. При «стали» в такой конструкции может быть модификатор, указывающий на определенный тип стали (например, «wootz steel sword» или «damascus steel knife»).
Не зная предметной области трудно сказать, как правильно.
Но в этом примере хотели показать семантику слова «painted».
Предметная область гуглится в момент: Google Books. Там предложение начинается с «The M1935 and M1942 standard steel helmets...».
Я не уверен на 100%, но по-прежнему склоняюсь к тому, что здесь не идёт речь о «стандартной стали», так как текст о внешнем виде экипировки.
Я не уверен на 100%, но по-прежнему склоняюсь к тому, что здесь не идёт речь о «стандартной стали», так как текст о внешнем виде экипировки.
Таки нет. Если гуглить дальше, то M1935 и M1942 — это не марки стали, а типы шлемов.
Модификатор standard может относиться и к helmets, и к steel. В данном случае выбор можно сделать только на семантическом уровне, а до него не дотянуться. И морфология, и грамматика, и синтаксис разрешают обе формы.
Как боретесь с тем, что «кровать» — это глагол?
UFO just landed and posted this here
Особенно если учесть, что «совать» и «ховать» — в самом деле глагол. У которых, кстати, изумительно различаются формы первого лица или императивы. Известна, собственно, история (возможно, и легенда) про команду цесаревича Александра Василию Андреевичу Жуковскому спрятать портсигар в карман.
(не успел добавить в предыдущий комментарий...)
Немецкие существительные чувствительны к регистру, так что Gemächt.
а не существительное «gemächt».
Немецкие существительные чувствительны к регистру, так что Gemächt.
>Вернемся к нашим куздрам
А вот и правда, вернитесь. Чем будет являться это слово — существительным женского рода или прилагательным в краткой форме?
И как вы это определите?
А вот и правда, вернитесь. Чем будет являться это слово — существительным женского рода или прилагательным в краткой форме?
И как вы это определите?
Может быть и наречие, как «вчера».
Или сущ. м.р. в род.п.: «кого? куздра»
Или сущ. м.р. в род.п.: «кого? куздра»
Да-да, а «Глокая» — деепричастие от глагола «глокать». Запятая где-то потерялась. В этом случае «штеко» становится подлежащим. Если «куздра» — наречие, то подлежащим, вероятно, будет «глокая» («Кудрявая вчера сильно обидела бобра»?), а вот варианта с кратким прилагательным найти не получается: оно упорно хочет быть сказуемым, причём быть поближе к концу предложения.
В общем, оценка вероятности грамматической структуры должна слегка помочь.
В общем, оценка вероятности грамматической структуры должна слегка помочь.
Добрый день.
Спасибо за интересную серию статей.
А как правильно следует писать лемматизатор? Сталкивался с этой задачей в ВУЗе — ничего толкового не нашёл кроме, как использование регулярных выражений.
Спасибо за интересную серию статей.
А как правильно следует писать лемматизатор? Сталкивался с этой задачей в ВУЗе — ничего толкового не нашёл кроме, как использование регулярных выражений.
Когда-то у меня возникала такая задача для составления «облака тэгов» (на самом деле, это был скорее частотный словарь) для библиотеки. Я использовал стеммер и, собственно, словарь, в котором все слова были в начальных формах. Стеммер выделял основу, по основе я искал подходящие слова, а какое из них использовать — смотрел частоту появления этого слова в анализируемом корпусе текстов.
Впрочем, я не уверен, что это _правильный_ способ лемматизации. Но результат получился довольно сносный, и работало не очень медленно (46 тыс. текстов), хотя и написано было на php.
Впрочем, я не уверен, что это _правильный_ способ лемматизации. Но результат получился довольно сносный, и работало не очень медленно (46 тыс. текстов), хотя и написано было на php.
Sign up to leave a comment.
Роль морфологии в компьютерной лингвистике