arttom2 июл 2018 в 12:20

Слово лингвисту: что если компьютеры заговорят лучше нас

10 мин

9.9K

Искусственный интеллектСемантические сети *

+24

Комментарии 59

Kolegg 2 июл 2018 в 12:29

С табличкой про шахматы совсем беда.

Из 100 игр с нормального начального положения AlphaZero выиграл 25 партий белыми, 3 чёрными и свёл вничью оставшиеся 72 (с)wikipedia.org/wiki/AlphaZero

фиш не выиграл ни одной партии, а ничьих 72 вместо 3.

arttom 2 июл 2018 в 12:37

Все так. Перепутал заголовки в таблице, спасибо

vikarti 2 июл 2018 в 12:50

Вот интересно мнение специалистов по машинному переводу про ситуации вроде habr.com/post/414485

5oclock 3 июл 2018 в 16:11

Про пророссийских боевиков тоже показательно было.
Потом исправили.

saboteur_kiev 2 июл 2018 в 13:05

Еще один пример. Человеку-переводчику и машинному переводчику на базе последних разработок и нейросетей дается две фразы. Что будет?

1. Привет, мир.
2. Переводчик, измени в первом предложении слово мир на слово Хабр.

Результат очевиден — человек поймет текст, машинный переводчик — выполняет программу.

vikarti 2 июл 2018 в 13:57

А пример не совсем искуственный же.
У Толкиена в приложении к Сильму и ВК — было указано как именно (и в каких случаях) нужно переводить имена/топонимы и почему — именно так.
Даже не все люди-переводчики тех изданий что издавались в России — это прочитали и сделали как написано.

Даже без спецзамечаний автора проблемы будут:

Как на русский язык переводится «Honor Harrington»? А если учесть что это — имя и фамилия? И что имя в данном случае — «говорящее»? И либо у нас получается не существующее в русском языке имя Честь либо меняем имя на Викторию что немного подходит по смыслу (в официальном издании она Виктория, в большинстве любительских переводов — Честь)
где фраза то одна…

А как переводится Miles Vorkosigan? (у аристократов Барраяра все фамилии начинаются на vor). А если учесть русский был одним из официальных языков Барраяра до Периода Изоляции и персонажи в курсе как это на русском звучит и даже поговорка есть "«Vor does mean 'thief'!»". А если учесть что по словам автора — идея была про аналогию с 'фон' а когда автору сказали — она решила что хорошая идея и ввела в том числе и поговорку и историческое обоснования?
Во всех вариантах русского перевода — аристократы таки форы а не воры.

Bedal 3 июл 2018 в 06:40

Вспоминается персонаж, которого зовут Эркюль Пуаро. И что, многие из русскоязычных читателей понимают, почему и зачем его так зовут? Судя по фильмам, и англоязычные (американоязычные) не все понимают.
Так что — у людей с этой проблемой дела обстоят не так, чтобы принципиально лучше, чем у железки.

vikarti 3 июл 2018 в 16:52

Если я покупаю официальное издание на русском языке — я по крайней мере ожидаю что переводил профессиональный переводчик а не.

У людей тоже не всегда хорошо, но скорее потому что идиоты-переводчики (или их начальство).

Питер Гамильтон, ладно — перевести habitat как хабитат — еще можно (речь про весьма нехилых размеров космические станции на которых именно живут, часть из них — даже суверенные государства), но почему в следующей книге тоже самое — названо обиталищем? Переводчик книги не читал предыдущую? И там же — «interstellar ark» это у нас оказывается — «межзвездная арка»?! (
(издание 2002 года, гугл уже был, можно было хоть посмотреть, там сразу все понятно, и какой будет правильный перевод на русский — тоже понятно (корабль поколений), Если гугла нет, словаря нет, уж Noah Ark то как эталонно переводится?
(если что — гуглотранслейт это переводит как межзвездный ковчег — ну хоть по смыслу понятно что имелось ввиду (в отличии от «арки») ).

Bedal 4 июл 2018 в 05:19

Ну и я добавлю, что проблема просто нерешаема. Достаточно посмотреть во времена, когда иных переводов, кроме профессиональных, не издавалось. «Основание» Азимова не во всех изданиях так называлось. Да и проблема с именами и тогда была неразрешимой: что лучше, Сумкинс или Бэггинс?
Хорошо, если переводчик сам по себе гениален, как Маршак или Гнедич, но чаще же — нет.

saboteur_kiev 3 июл 2018 в 09:18

Это неважно. Люди не всегда читают примечание.
Важно то, что человек, прочитав эту фразу, может поступить иначе, чем просто перевести. Например воспользоваться советом, проигнорировать и так далее.

Компьютерный переводчик, который не понимает смысла текста, будет всегда переводить. Либо реакция на фразу в нем должна быть заранее запрограммирована.

Bedal 4 июл 2018 в 07:57

рассказ Тэффи из жизни русских эмигрантов: «Так, например, вошла в обиход частица “вор”, которую ставят перед именем каждого лерюсса: вор-Акименко, вор-Петров, вор-Савельев. Частица эта давно утратила свое первоначальное значение и носит характер не то французского “Le” для обозначения пола именуемого лица, не то испанской приставки “дон”...».

Bedal 4 июл 2018 в 08:10

del

ChePeter 2 июл 2018 в 13:49

Лет сорок назад знакомые инженеры получили на хорошем заводе компьютер-переводчик. И перевели через «машинный переводчик» на английский и обратно фразу:
«И кто его знает, зачем он моргает» — про любовь! Слова из песни.
Получили: «никто не знает, что у него с глазом» — про офтальмологию
А теперь на телефоне выдает «И кто знает, почему он мигает» про светофор и дорожное движение

Мало что изменилось и поменялось.
Попробуйте перевести на английский и обратно гуглем
Ты жива еще моя старушка,
Жив и я. Привет тебе, привет

You're still alive, my old lady,
I'm alive too. Hello to you, hello

Ты все еще жив, моя старушка,
Я тоже жив. Привет вам, привет

НЛО прилетело и опубликовало эту надпись здесь

PavelMSTU 2 июл 2018 в 14:26

Из «Кибериады» Станислава Лема

Путешествие первое А, или Электрувер Трурля

Две недели подряд вводил Трурль в своего будущего электропоэта общие программы; потом наступила настройка логических, эмоциональных и семантических контуров. Уже было собрался он пригласить Клапауция на пробное испытание, но раздумал и сначала запустил машину в одиночку. Та немедля прочла доклад о полировке кристаллографических шлифов для вводного курса малых магнитных аномалий. Пришлось ослабить логические контуры и усилить эмоциональные; сперва машину одолел приступ икоты, затем припадок истерии, наконец, она с большим трудом пробормотала, что жизнь ужасна. Он усилил семантику и смастерил приставку воли; тогда она заявила, что отныне он должен ей подчиняться, и приказала достроить ей еще шесть этажей к девяти имеющимся, чтобы она могла на досуге поразмыслить о сущности бытия. Вставил он ей философский глушитель; после этого она вообще перестала откликаться и только колотила током. Умолял он ее, умолял и смог уговорить лишь спеть короткую песенку «Жили-были дед да баба, ели кашу с молоком», на чем ее вокальные упражнения кончились. Тогда начал он ее прикручивать, глушить, усилять, ослаблять, регулировать, пока не решил, что все в лучшем виде. Тут и угостила она его такими стихами, что возблагодарил он небеса за эту прозорливость: то-то бы потешился Клапауций, заслышав эти занудливые вирши, ради которых пришлось промоделировать возникновение Космоса и всех возможных цивилизаций! Вставил он ей шесть противографоманских фильтров, но они вспыхивали, как спички; пришлось изготовить их из корундовой стали. Тут понемногу стало у него налаживаться; он дал машине полную семантическую развертку, подключил генератор рифм, и чуть было все опять не полетело в тартарары, так как машина пожелала быть миссионером у нищих звездных племен. Однако в тот последний момент, когда он уже готов был наброситься на нее с молотком в руках, пришла ему в голову спасительная мысль. Он выбросил все логические контуры и вставил на их место ксебейные эгоцентризаторы со сцеплением типа «Нарцисс». Машина закачалась, засмеялась, заплакала и сказала, что у нее побаливает где-то на уровне третьего этажа, что ей все уже до лампочки, что жизнь удивительна, а все кругом негодяи, что она, наверное, скоро умрет, и желает только одного? — чтобы о ней помнили и тогда, когда ее не станет. Затем велела подать ей бумагу. Трурль облегченно вздохнул, выключил ее и отправился спать. Утром он зашел, за Клапауцием. Услышав, что его зовут на запуск Электрувера, как решил Трурль назвать свою машину, Клапауций бросил все свои дела и пошел в чем был, так не терпелось ему поскорее стать свидетелем поражения Друга.
Трурль прежде всего включил нагревательные контуры, потом дал малый ток, еще несколько раз взбежал наверх по гремящим железным ступенькам — Электрувер похож был на огромный судовой двигатель, весь в стальных мостках, покрытый клепаным железом, со множеством циферблатов и клапанов, — и вот, наконец, запыхавшийся, следя, чтобы не падало напряжение, он заявил, что для разминки начнет с маленькой импровизации. А потом уж, конечно, Клапауций сможет предложить машине любую тему для стихов, какую захочет.
Когда амплификационные указатели дали знать, что лирическая мощность достигла максимума, Трурль, рука которого чуть заметно дрожала, включил большой рубильник, и почти сразу машина произнесла голосом слегка хриплым, но изобилующим чарующими и убедительными интонациями:
— Общекотовичарохристофорная хрящетворобка.
— И это все? — выждав некоторое время, необычайно вежливо спросил Клапауций. Трурль стиснул зубы, дал машине несколько ударов током и снова включил. На этот раз голос оказался значительно чище; им можно было просто наслаждаться, этим торжественным, не лишенным обольстительных переливов баритоном:

Лопотуй голомозый, да бундет грывчато
В кочь турмельной бычахе, что коздрой уснит,
Окошел бы назакрочь, высвиря глазята,
А порсаки корсливые вычат намрыд!

— По-каковски это? — осведомился Клапауций, с великолепной невозмутимостью наблюдая за паникой Трурля; тот метался у пульта управления, затем, махнув в отчаянии рукой, помчался, топая по ступеням, на самый верх стальной громадины. Видно было, как он на четвереньках вползает сквозь открытые клапаны в нутро машины, как стучит там молотком, яростно ругаясь, как что-то закручивает, бренча разводными ключами, как снова выползает и вприпрыжку бежит на другой помост; наконец он издал торжествующий вопль, выбросил перегоревшую лампу, которая с грохотом разбилась о пол в двух шагах от Клапауция, даже не подумав извиниться за такую небрежность, поспешно вставил на ее место новую, вытер грязные руки ветошью и закричал сверху, чтобы Клапауций включил машину. Раздались слова:

Три, самолож выверстный, вертяшку сум воздлинем,
Секливой аппелайде и боровайка кнется,
Гренит малополешный тем перезлавским тринем,
И отмурчится бамба, и голою вернется.

— Уже лучше! — воскликнул, правда не совсем уверенно, Трурль. — Последние слова имели смысл, заметил?
— Ну, если это все… — промолвил Клапауций, который был сейчас олицетворением изысканнейшей вежливости.
— Черт бы его побрал! — завопил Трурль и снова исчез во внутренностях машины: оттуда доносился лязг, грохот, раздавались треск разрядов и проклятия конструктора. Наконец он высунул голову из небольшого отверстия на третьем этаже и крикнул:
— Нажми-ка теперь!
Клапауций выполнил просьбу. Электрувер задрожал от фундамента до верхушки и начал:

Грызнотвурога жуждя, голонистый лолень
Самошпака мимайку…

Голос оборвался — Трурль в бешенстве рванул какойто кабель, что-то затрещало, и машина смолкла. Клапауций так хохотал, что в изнеможении опустился на подоконник. Трурль кидался туда и сюда, вдруг что-то треснуло, звякнуло, и машина весьма деловито и спокойно произнесла:

Зависть, чванство, эгоизм, по словам Конфуция,
До добра не доведут — знает это и болван.
Словно краба грузовик, так и Клапауция
Мощью замыслов раздавит духа великан!

— Вот! Пожалуйста! Эпиграмма! И прямо не в бровь, а в глаз! -выкрикивал Трурль, описывая круги, все ниже и ниже, ибо он сбегал вниз по узкой спиральной лестничке, пока почти не влетел в объятия коллеги, который перестал смеяться и несколько оторопел.
— — А, дешевка, — сказал тут Клапауций. — Кроме того, это не он, а ты сам!
— Как это я?
— Ты это сочинил заранее. Догадываюсь по примитивности, бессильной злости и банальным рифмам.
— Ах вот как? Ты предложи что-нибудь другое! Что захочешь! Ну, что же ты молчишь? Боишься, а?
— Не боюсь, а просто задумался, — сказал задетый за живое Клапауций, стараясь найти самое трудное из возможных заданий, поскольку не без основания полагал, что спор о качестве стихотворения, сложенного машиной, трудно будет разрешить.
— Пусть сочинит стихотворение о кибэротике! — сказал он наконец, радостно усмехаясь. — Пусть там будет не больше шести строк, а в них о любви и измене, о музыке, о неграх, о высшем обществе, о несчастье, о кровосмесительстве — в рифму и чтобы все слова были только на букву «К»!
— А полного изложения общей теории бесконечных автоматов ты случайно не предложишь? — заорал оскорбленный до глубины души Трурль. — Нельзя же ставить таких кретинских усло…

И не договорил, потому что сладкий баритон, заполнив собой весь зал, в этот момент отозвался:
Кот, каверзник коварный, кибэротоман,
К королеве кафров крадется Киприан.
Как клавесина клавишей, корсажа касается.
Красотка к кавалеру, конфузясь, кидается…
… Казнится краля, киснет: канул Купидон,
К кузине королевы крадется киберон!

— Ну, и что ты скажешь? — подбоченился Трурль, а Клапауций, уже не раздумывая, кричал:
— А теперь на «Г»! Четверостишие о существе, которое было машиной, одновременно мыслящей и безмозглей, грубой и жестокой, имевшей шестнадцать наложниц, крылья, четыре размалеванных сундука, в каждом из которых по тысяче золотых талеров с профилем короля Мурдеброда, два дворца, проводившей жизнь в убийствах, а также…
— Грозный Генька-генератор грубо грыз горох горстями… -начала было машина, но Трурль подскочил к пульту управления, нажал на рубильник и, заслонив, его собственным телом, промолвил сдавленным голосом:
— Все! Не будет больше подобной чепухи! Я не. допущу, чтобы погубили великий талант! Или ты будешь честно заказывать стихи, или на этом все кончено!
— А что же — те стихи были заказаны нечестно?.. — начал Клапауций.
— Нет! Это были головоломки, ребусы какие-то! Я создавал машину не для идиотских кроссвордов! Ремесло это, а не Великое Искусство! Давай любую тему, самую трудную…
Клапауций думал, думал, аж сморщился весь и сказал:
— Ладно. Пусть будет о любви и смерти, но все должно быть выражено на языке высшей математики, а особенно тензорной алгебры. Не исключается также высшая топология и анализ. Кроме того, в стихах должна присутствовать эротическая сила, даже дерзость, но все в пределах кибернетики.
— Ты спятил. Математика любви? Нет, ты не в своем уме… -возразил было Трурль. Но тут же умолк враз с Клапауцием, ибо Электрувер уже скандировал:

В экстремум кибернетик попадал
От робости, когда кибериады
Немодулярных групп искал он интеграл.
Прочь, единичных векторов засады!
Так есть любовь иль это лишь игра?
Где, антиобраз, ты? Возникни, слово молви-ка!
Уж нам проредуцировать пора
Любовницу в объятия любовника.
Полуметричной дрожи сильный ток
Обратной связью тут же обернется,
Такой каскадной, что в недолгий срок
Короткой яркой вспышкой цепь замкнется!
Ты, трансфинальный класс! Ты, единица силы!
Континуум ушедших прасистем!
За производную любви, что мне дарила
Она, отдам я Стокса насовсем!
Откроются, как Теоремы Тела,
Твоих пространств ветвистые глубины,
И градиенты кипарисов смело
Помножены на стаи голубиные.
Седины? Чушь! Мы не в пространстве Вейля,
И топологию пройдем за лаской следом мы,
Таких крутизн расчетам робко внемля,
Что были Лобачевскому неведомы.
О комитанта чувств, тебя лишь знает
Тот, кто узнал твой роковой заряд:
Параметры фатально нависают,
Наносекунды гибелью грозят.
Лишен голономической системой
Нуля координатных асимптот.
Последних ласк, — в проекции последней
Наш кибернетик гибнет от забот.

На этом и закончилось поэтическое турне; Клапауций тут же ушел домой, обещав, что вот-вот вернется с новыми темами, но больше не показывался, опасаясь дать Трурлю еще один повод для триумфа; что же касается Трурля, то он утверждал, будто Клапауций удрал, не будучи в силах скрыть непрошеную слезу. На это Клапауций возразил, что Трурль с той поры, как построил Электрувера, видимо, свихнулся окончательно.
Прошло немного времени, и слух об электрическом барде достиг ушей настоящих, я хочу сказать обыкновенных, поэтов. Возмущенные до глубины души, они решили не замечать машины, однако нашлось среди них несколько любопытных, отважившихся тайком посетить Электрувера. Он принял их учтиво, в зале, заваленном исписанной бумагой, так как сочинял днем и ночью без роздыху. Поэты были авангардистами, а Электрувер творил в классическом стиле, ибо Трурль, не очень-то разбиравшийся в поэзии, основывал вдохновляющие программы на произведениях классиков. Посетители высмеяли Электрувера, да так, что у него от злости чуть не полопались катодные трубки, и ушли, торжествуя. Машина, однако, умела самопрограммироваться, и был у нее специальный контур усиления самоуверенности с предохранителем в шесть килоампер, и в самый короткий срок все изменилось самым решительным образом. Ее стихи стали туманными, многозначительными, турпистическими, магическими и приводили в совершеннейшее отупение. И когда прибыла новая партия поэтов, чтобы поиздеваться и покуражиться над машиной, она ответила им такой модернистской импровизацией, что у них в зобу дыханье сперло; от второго же стихотворения серьезно занемог некий бард старшего поколения, удостоенный двух государственных премий и бюста, выставленного в городском парке. С тех пор ни один поэт уже не в силах был сопротивляться пагубному желанию вызывать Электрувера на лирическое состязание — и тащились они отовсюду, волоча мешки и сумки, набитые рукописями. Электрувер давал гостю почитать вслух, на ходу схватывал алгоритм его поэзии и, основываясь на нем, отвечал стихами, выдержанными в том же духе, но во много раз лучшими — от двухсот двадцати до трехсот сорока семи раз,
Спустя некоторое время он так приноровился, что одним-двумя сонетами сваливал с ног заслуженного барда. А что хуже всего -оказалось, что из соревнования с ним с честью могут выйти лишь графоманы, которые, как известно, не отличают хороших стихов от плохих', потому-то они и уходили безнаказанно, кроме одного, Сломавшего ногу, споткнувшись у выхода о широкое эпическое полотно Электрувера, весьма новаторское и начинавшееся со строк:

Тьма. Во тьме закружились пустоты.
Осязаем, но призрачен след.
Ветер дунул — и взора как нет.
Слышен шаг наступающей роты.

В то же самое время настоящим поэтам Электрувер наносил значительный урон, хотя и косвенно — ведь зла им он не причинял. Несмотря на это, один почтенный уже лирик, а вслед за ним два модерниста совершили самоубийство, спрыгнув с высокой скалы, которая по роковому стечению обстоятельств как раз попалась им на пути от резиденции Трурля к станции железной дороги.
Поэты сорганизовали несколько митингов протеста и потребовали опечатать машину, но никто, кроме них, не обращал внимания на феномен. Редакции газет были даже довольны, поскольку Электрувер, писавший под несколькими тысячами псевдонимов сразу, представлял готовую поэму заданных размеров на любой случай, и эта поэзия, хоть и на заказ, была такого качества, что читатели раскупали газеты нарасхват, а улицы так и пестрели лицами, полными неземного блаженства, мелькали бессознательные улыбки и слышались тихие всхлипывания. Стихи Электрувера знали все; воздух сотрясали хитроумнейшие рифмы, а наиболее впечатлительные натуры, потрясенные специально сконструированными метафорами или ассонансами, даже падали в обморок; но и к этому был подготовлен титан вдохновения: он сразу же вырабатывал соответствующее количество отрезвляющих сонетов.
Сам же Трурль хлебнул горя из-за своего изобретения. Классики, по преимуществу люди весьма пожилого возраста, много вреда ему не причинили, если не считать камней, регулярно выбивавших окна, или веществ (не будем называть их), которыми забрасывали его дом. Куда хуже было с молодежью. Один поэт самого молодого поколения, стихи которого отличались большой лирической силой, а мускулы — физической, жестоко избил его. Пока Трурль отлеживался в больнице, события развивались дальше; не было ни дня без нового самоубийства, без похорон; перед больничным подъездом дежурили пикета и слышалась стрельба, так как вместо рукописей поэты все чаще прятали в своих сумках самострелы, разряжая их в Электрувера, стальной натуре которого пули, однако, не приносили вреда. Вернувшись домой, отчаявшийся и обессилевший конструктор однажды ночью решил разобрать на части собственными руками сотворенного гения.
Но когда он, слегка прихрамывая, приблизился к машине, та, завидев разводные ключи в его сжатой руке и отчаянный блеск в глазах, разразилась такой страстной лирической мольбой о милосердии, что растроганный до слез Трурль отбросил инструменты и пошел к себе, утопая по колени в новых произведениях электродуха, которые вскоре поднялись ему по пояс, наводняя зал шелестящим бумажным океаном.
Однако через месяц, когда Трурль получил счет за электричество, потребленное машиной, у него потемнело в глазах. Он был бы рад выслушать советы старого приятеля Клапауция, но тот исчез, как будто земля под ним разверзлась. Вынужденный действовать на собственный страх и риск, Трурль в одну прекрасную ночь обрезал питавший машину провод, разобрал ее, погрузил на космический корабль, вывез на один из небольших планетоидов и там снова смонтировал, присоединив к ней как источник творческой энергии атомный котел.
Затем он потихоньку вернулся домой, но на этом история не кончилась, так как Электрувер, не имея возможности распространять свои произведения в печатном виде, стал передавать их на всех радиоволнах, чем приводил экипажи и пассажиров космических ракет в лирический столбняк, причем особо тонкие натуры подвергались также тяжелым приступам восторга с последующим отупением. Установив, в чем дело, руководство космофлота официально обратилось к Трурлю с требованием немедленно ликвидировать принадлежащую ему установку, нарушающую лирикой общественный порядок и угрожающую здоровью пассажиров.
Вот тогда Трурль начал скрываться. Пришлось послать на планетоид монтеров, чтобы они запломбировали Электруверу лирические выходы, но он оглушил их балладами, и они не смогли выполнить поставленной перед ними задачи. Послали глухих, но Электрувер передал им лирическую информацию на языке жестов. Стали поговаривать вслух о необходимости карательной экспедиции или бомбежки. Но тут наконец машину приобрел один владыка из соседней звездной системы и вместе с планетоидом перетащил в свое королевство.
Теперь Трурль мог снова появиться и спокойно вздохнуть. Правда, на южном небосклоне то и дело вспыхивают сверхновые звезды, которых не помнят старожилы, и ходят упорные слухи, что тут не обошлось без поэзии. Рассказывают, будто по странному капризу упомянутый владыка приказал своим астроинженерам подключить Электрувера к созвездию белых гигантов, и каждая строчка стихов стала тут же претворяться в гигантские протуберанцы солнечные; таким образом величайший поэт Космоса огненными вспышками передает свои творения всем бесконечным безднам галактик сразу. Другими словами, великий владыка превратил его в лирический двигатель скопления переменных звезд. Если даже и есть в этом хоть доля правды, все это происходит слишком далеко, чтобы смутить праведный сон Трурля, который поклялся самой страшной клятвой никогда в жизни больше не браться за кибернетическое моделирование творческих процессов.

apiperski 3 июл 2018 в 03:39

Известный стиховед Татьяна Владимировна Скулачёва каждый год приходит на конференцию по компьютерной лингвистике «Диалог» (http://www.dialog-21.ru/), подходит к постерам и спрашивает: «А со стихотворными текстами ваш продукт будет корректно работать?» Все докладчики (и я в том числе) на этот вопрос начинают бормотать что-то невнятное :)

asm679 4 июл 2018 в 23:19

А Вы ещё не просили Алису почитать стихи? ;)

PavelMSTU 2 июл 2018 в 14:20

А представьте себе такую машинку в XVIII веке. Она казалась бы чудом, потому что вычисление было прерогативой человека.

Нет. Паскалина была изобретена уже в середине XVII века.

+ советую почитать «Мысли» Блеза Паскаля. Там он возмущается, что его Паскалину считают думающей машиной.

apiperski 2 июл 2018 в 15:10

Спасибо за ссылку! Когда я выбирал, какой век назвать, специально смотрел историю разных вычислительных машин и решил, что всё, что до XIX века — это курьёзы (или, если угодно, прототипы), и только потом уже — полноценные распространённые инструменты. Отдельное спасибо за указание на «Мысли», почитаю!

rg_software 3 июл 2018 в 02:47

Это хороший текст для «обычных людей» — такая вводная лекция, что это такое, и с чем едят.

Меня слегка расстраивает, что границы и достижения обсуждаются в достаточно общем ключе. Вот скажем, сейчас в тренде механизмы deep learning, и вроде как качество переводов растёт. Но не обсуждается, каковы границы этого роста и где мы снова остановимся.

Насколько я понимаю, сейчас идёт эволюционное развитие, повышение качества методов, работающих на основе данных и статистике (собственно, любое машинное обучение). Однако понятно, что у них тоже есть свои пределы.

Скажем, тот же Гугл не отслеживает связи между предложениями (а это может быть крайне важно), есть и куда более тонкие проблемы. Ну и, наконец, данные тоже не беспредельны: я вот слабо верю, что для любой пары более-менее развитых языков (навскидку, португальский-вьетнамский) можно найти достаточное количество параллельных текстов для надёжного обучения.

apiperski 3 июл 2018 в 03:36

Ну, это как-нибудь в следующий раз напишу :) Моя любимая статья на тему проблем нейросетевого машинного перевода — вот: https://arxiv.org/abs/1706.03872 (годичной давности, так что уже чуть устаревшая, но всё же).

НЛО прилетело и опубликовало эту надпись здесь

4Naoki 3 июл 2018 в 11:31

А здесь же вроде как все понятно.
Учитывая алгоритм, представленный выше, ИИ делит текст и выделяет наиболее значимые объекты. Во втором примере максимальным совпадением обладает имя собственное — Кевин Дюрант. Отсюда система и пляшет, зная его историю, она смотрит когда его задрафтили, какая команда это сделала и кто был губернатором.
Конечно, масштабы удивляют, но учитывая ресурсы компании, она может обрабатывать их с огромной скоростью.

Real3L0 3 июл 2018 в 06:59

Можете ли вы представить, что будете говорить по-русски хуже, чем какой-нибудь компьютер?

Если, как описано в статье, машина будет учиться говорить по современным текстам, то вряд ли она будет говорить лучше. Например, сейчас в РФ почти все пишут и говорят «в Украине».

strachkov 3 июл 2018 в 12:09

Сейчас ~~почти все~~ многие в РФ путают "-ться" и "-тся", но вы почему-то решили привести неоднозначный пример из ветки комментариев тематических блогов и телепрограмм.
Я Вам попробую объяснить. Русский язык, к сожелению одних и к радости других, развивается и иногда стремительными темпами. Вот не так давно были введены определенныеуточнения в нормах русского языка и кофе уже не только «черный», но и «черное». Ну, логика, как мне кажется, ясна. Ситуация заключается в том, что на неофициальном уровне кофе давно в том числе и «черное».
Нормы, сложившиеся не в рамках каких-либо логик (Украина таки не остров, и даже не полуостров, только отдельные части Украины — полуострова), а скорее вследствии влияний традиций могут быть адаптированы или уточнены.

Real3L0 3 июл 2018 в 12:39

Сейчас почти все многие в РФ путают "-ться" и "-тся"

К счастью, я общаюсь в кругах, где это (почти) не путают, поэтому и не знаю, что это большая проблема.

решили привести неоднозначный пример из ветки комментариев тематических блогов и телепрограмм.

Что мне больше/чаще всего режет слух, то и привёл.
Я знаю про нормы. Знаю про кофе. Знаю про развитие.
Но развитие — это одно, а нормы — другое. В случае «на Украину» развитие может и есть, но нормы никто не менял. А в статье речь именно о правильном произношении, а не о развитии. (Если, конечно, внезапно не стало, что говорить развивающимся русским языком — это более правильно, чем по нормам. :) )

5oclock 3 июл 2018 в 16:27

Интересна корреляция, проявляющаяся в Вашем круге общения: тся/ться не путают, а вот на "в Украину" — поддались.
Вырисовывается такой образованный либерал. Да?

Real3L0 3 июл 2018 в 20:25

Интересна корреляция, проявляющаяся в Вашем круге общения: тся/ться не путают, а вот на «в Украину» — поддались.

Во-первых, если немного подумать, то «тся/ться» встречается только в тексте (или в Ваших кругах общения это и устно говорят неправильно?), и в моём круге общения действительно пишут правильно.
Во-вторых, если быть немного внимательней, я не говорил, что «на Украину» используют в моём круге общения. Я слышу это, в основном, из телевизора.
В итоге имеем разные источники информации.

Вырисовывается такой образованный либерал. Да?

Образованному патриоту режет слух?

5oclock 3 июл 2018 в 20:56

Потакание носителей русского языка лингвистическим комплексам правителей соседней страны — да, слух режет.
Но это уже другая тема.

Real3L0 4 июл 2018 в 05:44

Осталось только понять, почему носителям русского языка режет слух «нормированный» русский язык?

5oclock 4 июл 2018 в 06:23

Шо це таке "нормированный русский язык"?

Real3L0 4 июл 2018 в 06:27

Правильный.

5oclock 4 июл 2018 в 06:29

По правде говоря, иногда и "правильный" режет. Потому как не говорит так народ.
Но и "в Украину" — тоже не говорит.

Real3L0 4 июл 2018 в 06:47

Потому как не говорит так народ.

До известных событий, абсолютно весь русский народ много лет именно так и говорил. И в школе так преподавали. То, что сейчас народ так не говорит, как я уже упоминал, не делает язык моментально правильным.

Но и «в Украину» — тоже не говорит.

Говорит. Одно время, только Первый канал в телевизоре РФ говорил правильно, но, кажется, и они скатились.

5oclock 4 июл 2018 в 07:21

Вас обманули, причём обман внедрили глубоко — вплоть до «навязывания альтернативной истории».
Но даже сами пояснения сторонников «в Украины» с отсылками в историю (мол Великороссы считали Малороссию окраиной, поэтому «на Окраину») — уже указывает на то, что всегда и говорили «на Украину».
И норма современного русского языка: «на Украину».
new.gramota.ru/spravka/buro/hot10/?v=full

Да что там говорить, сами украинцы поют:
«Як у нас на Украини, мы живём богато...»

Когда-нибудь, под лингвинистическим давлением с Украины возможно русский язык и изменится и все станут говорить «в Украину». Всё может быть: язык изменчив.
Но сейчас норма — «на Украину», а «в Украину» выглядит коверканием русского языка в угоду — именно комплексам украинских политиков.
Иными словами: глупостью выглядит.

Real3L0 4 июл 2018 в 08:12

А зачем Вы мне доказываете то, что я знаю и с чем согласен? :)

5oclock 4 июл 2018 в 08:18

Должно быть, неправильно понял что Вы считаете правильным в Вашем предыдущем посте.

VolCh 4 июл 2018 в 12:13

Поправка: в лучшем (для «на») случае — норма современного литературного языка.

В разговорной речи, а также в документах допустимы оба варианта. Можно проверить, например, на сайте Президента России (если не чистили недавно) Только с 2014-го года исключительно «на» употребляется, до этого то одно, до другое, с заметной корреляцией с российско-украинскими политическими отношениями.

То есть в целом русский язык уже изменился, максимум не изменилась литературная норма.

5oclock 4 июл 2018 в 12:51

В разговорной речи много что допустимо. Даже падонкафский диалект.
Но это не значит, что так теперь все говорят и что это — норма даже для разговорного языка. Это — диалект.
Так и с «вУкраиной».
В украинском диалекте русского языка этот вариант насаждают на госуровне.
Либеральные россияне с комплексом 2014 (у меня только такой портрет складывается) — перенимают это.
Но говорить о том, что этот вариант использует большинство россиян — большое преувеличение. Во всяком случае — пока.

VolCh 4 июл 2018 в 14:08

Ну Указ Президента России типа такого kremlin.ru/acts/bank/15242/page/2 — это скорее насаждение в российском диалекте русского языка на госуровне. Ну и самый либеральный россиянин перенял это ещё в 2000 году, подписав его.

5oclock 4 июл 2018 в 14:10

Что-то по вашей ссылке какая-то перепись населения, а не указ.
Ну и, согласитесь, языковые нормы указами президентов не устанавливаются :)

VolCh 4 июл 2018 в 14:32

Указ о предоставлении российского гражданства, в основном уроженцам других республик бывшего СССР.

Как по мне, то языковые нормы вообще не устанавливаются, а формируются :) А этот указ одно из свидетельств того, что в России вариант «в Украине» если на госуровне и не насаждают сейчас, то насаждали в 2000-м году, то есть значительно раньше чем 2014-й. Да и позже его встречаются «в» документах самого высокого уровня, в интервью высших лиц и т. п.

VolCh 3 июл 2018 в 09:01

А что значит «лучше»? Как по мне, то лучше быть не может, компьютер сможет стать неотличим от человека при слепом тестировании.

baragol 3 июл 2018 в 12:27

Ну все же мы отличаем Хармса от Донцовой :) Корректно будет сказать, что эти писатели просто р а з н ы е, но субъективно я отдаю предпочтение одному из них.

Считается, что отправленное сообщение никогда не равно принятому. Загвоздка 1) в интерпретации принимающего, 2) в способности отправителя выражать свои мысли так, чтобы «шума в сигнале» было меньше. Т.е. в самом примитивном раскладе — чтобы его поняли именно так, как он хотел.

В целом я согласен, что термин «лучше» не вполне подходит. Но если представить, что ИИ научится генерировать художественный текст, не сможет ли он [и тут мы переходим совсем в уж в психолингвистику и какую-то метафизику] точнее доносить смыслы или сразу множество смыслов в своих произведениях? Сможет ли ИИ когда-нибудь выстроить драматургию так, как не мог человек?

Простите за поток мыслей. Вопросов много, ответов мало. Оценка языка в какой-то момент становится очень субъективной штукой.

VolCh 4 июл 2018 в 12:45

Сейчас, наверное, можно говорить о появлении у человеческих языков новой функции (ну или качественное изменение существующей) — интерфейса взаимодействия человека с машиной, а не только человека с человеком, как было тысячелетиями, пускай и через машину или иные средства типа книг. До недавнего времени машины просто (ну не просто технически) передавали языковую информацию между людьми, помогали её искать, переводить и т. п., но не генерировали её сами (ну если не считать всяких бредогенераторов). Сейчас же мы вплотную подошли к тому, что машины начинают сами общаться с человеком, а не просто передавать языковую информацию от одного человека к другому. Собственно поэтому напрямую уже сравнивать нельзя. Машины уже могут худо бедно имитировать человека, через несколько лет во многих случаях мы уже и отличить не сможем, но потом наверняка возникнет это «р а з н ы е», когда не будет у машины стоять задачи имитировать человека.

SEN7759 3 июл 2018 в 16:28

Приведу банальные вещи...

Сознание связано с отражением, моделированием, распознаванием, анализом,
обработкой и хранением информации (память).

Смысл фразы: "Собака вошла в конуру", связан с образами/отражениями/моделями собаки, конуры, процесса движения, направления движения, нахождения внутри, распознаванием и с анализом цели действия, результата, возможных последствий/следствий, связей с другими событиями. Например, качественный перевод ИИ с одного языка на другой потребует сначала создания
анимированного образа, затем выявления смысла и формулировки его на другом языке.

Следовательно, нужны модели мира (вместилища об'ектов, их связей/отношений, возможных преобразований), об'ектов, преобразований/действий, программы распознавания об'ектов и преобразований, программы для сравнения и анализа и т.п. Реальное обучение происходит при использовании моделей, игр...

Closius 3 июл 2018 в 20:14

Правильно. По научному это называется «ассоциативная память». Есть определенные методы ее моделирования

martin__marlen 9 июл 2018 в 10:42

Да, и вопрос «Понимания»сводится к тому, насколько используется эти модели мира для перевода и насколько изменяются в процессе перевода.
В процессе перевода может выясниться, что ИИ не хватает адекватных понятий в целевом языке. Если для того, чтобы получить адекватное понятие ИИ поменяет характеристики ассоциативных связей или добавит новые связи и объекты в Свои модели Мира, то характер и адекватность этих изменений будут демонстрировать тот или другой уровень понимание.

SEN7759 9 июл 2018 в 15:06

Допустим ИИ анализирует свой видеоматериал. Он нашел действующий объект и не может сопоставить ему понятие из своего лексикона. Тогда он может описать его и (используя, например, расстояния (или функцию близости), создать для него термин. Аналогично для движения, преобразования. Затем, на основе опыта устанавливает связи, выявляет свойства нового объекта, явления. Модель мира открытая, пополняется и обобщается постоянно...

Closius 3 июл 2018 в 20:08

На самом деле все просто. Мозг это нейронная сеть, которая на самом деле опять же довольно просто устроена. Когда человек рождается у него в голове есть нейронная сеть в самом человеке есть начальные условия в виде генотипа. Дальше во время развития (воспитания в семье, на улице, в окружении каком-то) появляются новые связи, уточняются веса нейронов и тд…
К чему я это? А к тому, что человека (да и вообще все) можно сэмулировать на компьютере. В свою очередь компьютер и все в мире связано (это еще до конца не известно, но йоги говорят об этом).

И правильно автор задается вопросом «кто лучше говорит компьютер или человек». Человек хрош тем, что несовершенен. Но нейронная сеть сама по себе не совершенна, она не дает 100% ответа.

Frankenstine 4 июл 2018 в 05:51

Мозг это нейронная сеть, которая на самом деле опять же довольно просто устроена.

Не настолько просто как кажется. Достаточно хотя бы того, что каждый нейрон уникален (не говоря уже про их наборы), а нейропластичность позволяет им брать на себя нужную функцию вне зависимости от своей начальной конфигурации (того, как они обрабатывают входящие сигналы), причём это происходит без выделенного «управляющего» этим процессом, вплоть до того, что человек живёт и нормально «функционирует» без целого полушария или с какими-то считанными процентами оставшихся в живых нейронов (см. например, Мужчина, который живёт без 90% мозга, озадачил учёных), а окружающие (и сам человек) об этом не догадываются. Более того, нейроны могут работать не только в «обычную сторону», но и реверсивно. Ну а с учётом того, что нейроны — лишь небольшая часть клеток мозга (одних только нейроглий 40% от всего мозга), влияющих на обработку сигналов (которые, между прочим, бывают чаще химические, чем электрические), а некоторые функции до сих пор не изучены — ваше заявление

человека (да и вообще все) можно сэмулировать на компьютере

выглядит уж слишком наивно.

SEN7759 4 июл 2018 в 12:26

Переход сознания на искусственный носитель теоретически возможен. Уже есть искусственные нейроны (пока ещё относительно большие); можно снимать некоторую информацию с нейронов и активировать их. Мозг пластичен, т.е. если он будет работать с имплантами, то они будут брать все больше функций и памяти на себя. В некоторый период и сознание может перейти на такие носители (даже в том случае, если его природа и не будет достаточно изучена, поскольку исследовать функции и связи между 86 млрд нейронов (с тысячами дендридов каждый) и 150 млрд глиальных клеток очень сложно).

Frankenstine 4 июл 2018 в 16:10

Теоретически кагбэ возможен, да, однако практическая реализация симуляции мозга на данный момент стоит порядка полутора миллиардов долларов и всё ещё в процессе первичной подготовки, см. ru.wikipedia.org/wiki/Human_Brain_Project

SEN7759 5 июл 2018 в 05:45

Откуда Вы про первичность узнали? Они отчёты давно перестали в открытом доступе предоставлять.

Frankenstine 5 июл 2018 в 09:01

Вот в том-то и дело, что отчитываться, толком, не в чем. Проект буксует.
sciencebusiness.net/news/77294/%E2%82%AC1B-Human-Brain-Project-back-on-track-after-Commission-signs-new-contract

Some EU member states, expected to contribute half of the project’s overall budget, have not yet made any commitments.

Closius 3 июл 2018 в 20:16

И кстати говоря понятие лучше или хже говорить на языке — такого нет. Я считаю что например мой друган говорит лучше чем какой нить путин, так как я его понимаю прекрасно и он мне все очень классно объясняет, чего другой сделать не может, хотя говорит на литературном языке.

Wfladimir 4 июл 2018 в 08:15

ИИ заговорит человечьим языком, если произойдёт очередной революционный прорыв в цифровой или друго вычислительной технике.

pioneer 4 июл 2018 в 08:50

Интересно, почему не получил распространение подход с использованием чего-то наподобие UNL (https://en.wikipedia.org/wiki/Universal_Networking_Language)? На первый взгляд, неплохая попытка создать ту самую промежуточную машинно-ориентированную интерлингву, которую нейросети Гугла как-то создают внутри себя сами.

SEN7759 4 июл 2018 в 12:23

Хороший вопрос. 1. Лучше то, что делается, например, здесь http://wolframalpha.com

Аналогичный вопрос об эсперанто. Его легче изучать, регуляризировать, легче научить ИИ для более осмысленных диалогов с человеком...

Зарегистрируйтесь на Хабре, чтобы оставить комментарий