Как стать автором
Обновить
0
0

Пользователь

Отправить сообщение
Например, мы используем Пролог в промышленной системе (обработка естественного языка).
Я учил украинский в России как иностранный, и мне всегда нравилась форма синтетического будущего времени «виконуватиметься». :) Всегда хотел спросить: по ощущению носителей украинского языка, есть ли разница семантическая между «виконуватиметься» и «буде виконуватися»? То есть всегда ли эти формы взаимозаменяемы на 100%?
На самом деле произношение первично, а орфография вторична: она фиксирует произношение. Поэтому вопрос надо ставить не «откуда в слове women взялся звук i?» а «почему слово так пишется?» Ответ на второй вопрос — по аналогии с man/men. Выравнивание по аналогии — очень сильная тенденция в истории любого языка.
Нет, наоборот. В древнеанглийском было wīfmann ед.ч. и wīfmenn мн.ч., т.е. форма множественного числа образовывалась палатальной перегласовкой (умлаутом), как и в немецком. Однако из-за утраты различия между a и e в безударном слоге вследствие редукции формы ед.ч. и мн.ч. стали смешиваться, и в форме единственного числа звук i под влиянием предшествующего w сдвинулся назад до u, то есть произошла велярная перегласовка — процесс, обратный умлауту.
Попробуйте разместить устройство снизу от пользователя под острым углом. Блики от очков должны отразиться вверх и меньше попадать в камеру. Если устройство размещено под прямым углом по отношению к плоскости очков, разумеется, будут сильные блики. По моему опыту, больше влияет не оптическая сила очков (у меня -13), а наличие/отсутствие антибликового покрытия.
Я использую GazePoint GP3 — $495 за устройство и ПО. Для управления устройством и получения данных используется удобный открытый текстовый протокол, работающий поверх TCP (соответственно, SDK не нужен). Это не версия для разработчиков, а массовая, без каких-либо ограничений на использование в конечных продкутах.
Я согласен, что синтаксис есть объективное выражение семантики. Если предложение — это языковой знак, то синтаксис — это его план выражения (означающее), а семантика — план содержания (означаемое = значение = семантика). Другое дело, что семантика и смысл в естественном языке — тоже очень разные вещи.

Значение предложения «Мальчик пошёл в школу» выводится из синтаксической модели предложения плюс семантики составляющих это предложение слов: некий мальчик начал осуществлять перемещение в пространстве, и конечным пунктом этого перемещения является школа. А вот смысл этого предложения (то есть знание, которое мы этим предложением передаём собседнику) может быть совсем иным. Например, сказать «Мальчик пошёл в школу» — распространённый способ дать понять, что соответствующий ребёнок достиг школьного возраста и приступил к получению среднего образования (ср.: «он у меня в прошлом году в школу пошёл»).
Изумительно! Оно, оказывается, «через английский» не гнушается переводить… Совсем как переводчики на конференциях ООН :-) Спасибо за пример.
(Это «Беовульф», конечно.)
В английском языке даже исконно английские слова произносятся совсем не так, как пишутся. Английский язык немного похож в этом смысле на языки с иероглифической письменностью, в которых связи между написанием и произношением никакой нет.

Причина этого — в истории английского языка. Современная английская орфография фиксирует произношение среднеанглийского периода. С тех пор в языке произошло множество фонетических процессов, полностью изменивших произношение, а орфография осталась прежней.

Вообще скорость изменений в английском языке потрясает по сравнению с другими языками. Разумеется, на то есть исторические причины. Сравните с русским. Носитель современного русского языка вполне поймёт «Слово о полку Игореве» (12 в.): «Не лепо ли ны бяшеть, братiе, начяти старыми словесы трудныхъ повестiи о пълку Игореве, Игоря Святъславличя! Начяти же ся тои песни по былинамъ сего времени, а не по замышленiю Бояню...» А попробуйте показать носителю современного английского языка (11 в.): «Hwæt! We Gardena in geardagum, þeodcyninga, þrym gefrunon, hu ða æþelingas ellen fremedon...» Узнаются, наверно, только we и in :-)
Откуда возникла «Ницца»?
Я думаю, что «близость» dependency links к семантическим связям иллюзорна, так как dependency links выводятся из синтаксических связей путём формальной процедуры. В естественном языке отношения между синтаксисом и семантикой — совсем не такие, как в формальных языках. Например, в «языке» математической логики семантика (алгебра высказываний/предикатов) выводится из синтаксиса (исчисления высказываний/предикатов): доказано, что семантика полна относительно синтаксиса, а синтаксис полон относительно семантики. В естественном языке такая симметрия не сохраняется. Как бы «глубоко» мы не «залезали» в синтаксические структуры, семантику мы в них не найдём. Строго говоря, семантические связи можно устанавливать не между словами, а между понятиями. Эти связи можно, например, задать дугами семантического графа, в узлах которого находятся понятия (не слова!). Такой граф в общем случае будет неизоморфен графу синтаксическому.

Теория Хомского претендует на описание процессов, происходящих в мозгу человека при порождении и восприятии речи. Объективные данные наблюдений и экспериментов не согласуются с предсказаниями этой теории. Её влияние, думаю, связано с традицией — одно время она казалась весьма правдоподобной.

Вы говорите об учебниках русского для финов?
А в украинском есть случаи, когда произношение отличается от написания? Там ведь весьма однозначное соответствие орфографии и транскрипции, разве нет?
А для синтаксических анализаторов красив знаменитый пример Р.Г.Пиотровского: «Об этом уже уже можно сказать, что он не уже молодого ужа». Судя по материалам aot.ru, у них в синтаксическом анализаторе предусмотрено отдельное правило (они называют синтаксические правила «форматками») для «борьбы» с «ужами».
«Сам Хомский прежде всего лингвист» — на самом деле, он прежде всего логик (по образованию), и его теория формальных грамматик начиналась разрабатываться именно для формальных языков, каковыми являются языки аксиоматических теорий (семантика которых выводится из синтаксиса). Для них она «работает», для естественных языков — к сожалению, нет. Замечу, что лингвистические идеи Хомского были и остаются влиятельными практически во всех странах, кроме Великобритании и бывшего СССР.

Упомянутый в статье стенфордский парсер действительно строит «хомскианское» дерево непосредственных составляющих (НС), наподобии проиллюстрированного рисунком «из Википедии». Но он также может привести это дерево к виду списка зависимостей (так называемые Stanford typed dependencies) между словами. Преобразование между этими двумя синтаксическими представлениями предложения с вычислительной и лингвистической точек зрения тривиальны, следовательно, разница только в удобстве для пользователя.

Дерево зависимостей, к сожалению, не показывает семантические связи между элементами предложения, как утверждается в статье. Оно показывает синтаксические связи.

Не совсем понятно, что такое «предикативное предложение». Предикативность — это неотъемлемое свойство предложения, всякое предложение по определению предикативно. Даже если в нём нет финитного глагола.
Для какого языка?
Коллеги, знающие японский, подсказали, что в японском всё-таки есть общее слово для старшего и младшего брата — «nii (nii-chan)». Сам я японского не знаю, потому корректность примера не могу оценить. Пример с финским, в котором нет грамматической категории рода («он — она — оно»), разумеется, корректен.
Что касается «массы тонкостей», которых очень много в любой естественной грамматике и с которыми неизбежно сталкиваешься при попытке выучить иностранный язык, выйдя из сензитивного возраста (лет так после 12-ти), не думаю, что здесь проблема в отсутствии «согласия в товарищах». В частности, вопрос о том, выделять или нет местный падеж (локатив) из предложного падежа (препозитива) — с теоретической точки зрения есть вопрос определения падежа, а выбор конкретной теории определяется задачей, которая изначально ставится при описании грамматики. Например, задача, которую ставит перед собой учитель в средней школе (научить учеников правильно писать безударные окончания существительных) требует теории с шестью падежами, задача автоматического построения parse tree требует морфологической теории уже как минимум с 12-ю падежами.

Перечень морфологических классов, которые могут быть приписаны слову конкретным морфологическим анализатором, обычно в явном виде приводится в документации к последнему, что помогает сделать правильный выбор лингвисту, выбирающему модуль морфологического анализа для конкретного проекта.
«Надо сказать, гугл-переводчик в разборе совсем плох»

Гугл-переводчик не разбирает синтаксис, так как работает по статистическому принципу, на основе параллельных (выравненных) корпусов, лингвистическое описание системы языка при таком подходе не используется. Описанная в статье схема морфологического — синтаксического — семантического анализа соответствует «алгебраическому» (= алгоритмическому) подходу к автоматической переработе текста, который работает на основе формализованных описаний соответствующих уровней языка.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность