Как стать автором
Обновить

Комментарии 19

Ух, «Чомски» режет глаз. Ноам Хомский же!
В литературе используются оба этих варианта, и гибридный «Чомский» тоже.
Сам себя он называет Чомски, и мы ему не указ.
Королева Елизавета тоже не «Елизавета» себя называет, и что с того? Это другой язык и другие правила.
Американцы называют Москву Moscow, а Россию Russia.
А мы почему-то 北京 (Běijīng) называем Пекином.
И в России давно принято называть Chomsky Хомским, иначе хрен ты что найдёшь в научной литературе, если искать по «Чомскому», да и не поймёт никто что это за человек.
Кстати, некоторые иностранные слова на родном языке могут звучать вульгарно www.skyscanner.ru/hotels/china/xin-hui-hotels/ci-45604217
Так что приходится менять настоящее название на похожее.

P.S Ждём продолжения цикла :-)
И в России давно принято называть Chomsky Хомским, иначе хрен ты что найдёшь в научной литературе, если искать по «Чомскому», да и не поймёт никто что это за человек.


(«Теория языка», 2009)

некоторые иностранные слова на родном языке могут звучать вульгарно

Это неправильная транслитерация. Они взяли название на китайском записанное латинскими буквами (система пиньинь) и транслителировали её на русский по правилам транслитерации с английского языка.

Для пары китайский-русский официально принята система Палладия. По ней китайский слог "hui" на пиньине на русском записывается как "хуэй". И звучит тоже как-то похоже на эту русскую запись.

Фамилия его происходит от названия белорусского города Хомск и довольно странно передавать её на русском иначе как Хомский. Кроме того, Ноам является Хомским во всех переводах его работ на русский язык, а в том же scholar.google.com вариант «Хомский» встречается в 9 раз чаще.
PS Имена и фамилии часто читаются по правилам языка происхождения, а не родного языка носителя, того же Эйзенхауэра вспомним.
PPS Слово «topicalization» на русский отлично переводится как «тематизация». Ладно ещё для «scrambling» перевод подобрать сложно, хотя и есть слово «перемешивание», но тематизация встречается в книгах по лингвистике ещё советского выпуска, термин не новый.
Наверное, вы и канадского хоккеиста по имени Travis Zajac называли бы Зайонцем, а не Зэйджаком? И премьера Квинсленда по имени Annastacia Palaszczuk — Анастасией Палащук, а не Анастейшей Палашек? Вот ведь неучи на ria.ru и vesti.ru!

Речь не о «правилах языка» — как ни иронично в этом топике — а о том, как человек называет себя сам. Ниже упомянули С. Клейни, фамилия которого читается не по правилам никакого языка. Экс-премьер Новой Зеландии David Lange — это Лонги, американская журналистка Dorothea Lange — это Лэнг, а американский актёр Ted Lange — это Лэндж, хотя фамилии их троих и пишутся одинаково.
Вот ведь неучи на ria.ru и vesti.ru!
Вот это можно написать без иронии, они часто вообще не задумываются над текстом своих публикаций, лишь бы новость раньше конкурентов выдать. Вот, например, в этой статье vesti.ru вместо того, чтобы выяснить правильное название деревни, транслитерировали его как смогли с английского написания. В результате Цгуну превратилось в Куну. А Восточно-Капскую провинцию в этой же статье обозвали Восточным Кейпом.
Речь не о «правилах языка» — как ни иронично в этом топике — а о том, как человек называет себя сам.
Увы, при написании статей о людях не столь важно, как они называют себя. Гораздо важнее, как их называют другие, и по этому критерию в России вариант «Хомский» оптимальный. Заметку в стиле «сам он произносил сою фамилию как /ˈtʃɒmski/» можно добавить в сноску или написать в скобках.

У нас таки привычно ещё и "Клини" (например, "звёздочка Клини"). Это при том, что в вики таки


Stephen Cole Kleene (/ˈkleɪni/ KLAY-nee;
Although his last name is commonly pronounced /ˈkliːni/ KLEE-nee or /kliːn/ KLEEN, Kleene himself pronounced it /ˈkleɪni/ KLAY-nee. His son, Ken Kleene, wrote: "As far as I am aware this pronunciation is incorrect in all known languages. I believe that this novel pronunciation was invented by my father."

Я думаю, таки надо писать "Клини" (при необходимости уточнить — в сноске, не в основном тексте).

Есть книжка про формальные грамматики в приложении к компиляции программ
Маккиман У., Хорнинг Дж., Уортман Д. — Генератор компиляторов М.: Статистика 1980. Весь теоретический базис грамматического разбора там представлен. Книга про компиляторы такого же уровня, как книги Кнута про программирование.
Книгу можно скачать с либрусека
Мой пост посвящён как раз тому, что грамматический разбор естественных языков имеет очень мало общего с грамматическим разбором языков программирования, и требует существенно другой теоретической основы.

А можно заявку на статью? Напишете, пожалуйста, про то, как генерировать осмысленный текст с нужным смыслом по подобным грамматикам? А статей на тему "как понять естественный язык" — этого много, а статей о том, как сказать что-нибудь на естественном языке — значительно меньше. Я понимаю, что возможно, это очевидно и тривиально, если темой занимаешься, но всем прочим может быть полезно.


Я, например, давно хочу увидеть генератор бессмысленных, но грамматически правильных парольных фраз с гарантированной энтропией. Но найти не могу. А написать самому пока не получается — подготовки не хватает.

Тут, к сожалению, плохо с энтропией. 118 миллионов фраз — это 26 бит. Для систем перебора — ничто.

комбинируйте наздоровье!

Смысл пропадает. Похожесть мешает. Начинаешь гадать "Да как там было-то? Так или наоборот?"

Спасибо, и впрямь интересно, допер уже кто до нормального парсинга на каком-то семантико-синтаксическом словаре для инглиша. Так то только по частям речи парсинг может норм работать будет только для простейших предложений. Последнее обнаружено мной при создании семантического анализатора для русиша.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий