Comments / Profile of erwins22 / Habr

@erwins22^{read⁠-⁠only}

Пользователь

Как Яндекс научил машину самостоятельно создавать переводы для редких языков

erwins22 Dec 19 2016 at 16:29

можно попробовать упростить.

есть начальный корпус и множество других предложений.
делаем допустим 5 сетей с разной инициализацией. и обучаем на размеченном корпусе.
далее прогоняем по оставшимся предложениям и там где все 5 сетей разбирают предложение одинаково включаем в обучающую выборку с коэффициентом 0,8 (если например коэффициент обучения 0,0001 то для этих данных будет 0,0001*0,8)
далее повторяем для оставшихся с последовательно убывающими коэффициентами обучения.

или можно сжимать информацию ставя на вход image

Как Яндекс научил машину самостоятельно создавать переводы для редких языков

erwins22 Dec 19 2016 at 15:15

когда я читаю топики Яндекса, то вообще не вижу технической информации. Это удручает. Схема сети сильно порадовала бы.

Как Яндекс научил машину самостоятельно создавать переводы для редких языков

erwins22 Dec 19 2016 at 14:20

Извиняюсь, я так и хотел сказать, что Яндексу требуется меньше данных за счет предобработки. Но вы становитесь заложниками такого подхода, правильности определения и т д.

Не пытались использовать SyntaxNet?
Прогоняете SyntaxNet, получаете дополнительную информацию о предложении и обучаете с доп информацией?
кроме единичного вектора слова, еще тип речи, взоимосвязанность и т д
кроме того для языков с падежами можно существенно сократить количество слов за счет передачи именительного падежа и принадлежности слова (кто ему подчинен, кому он подчинен), в принципе можно перестраивать предложение в языково независимую структуру. что должно упростить обучение разных языков.

Как Яндекс научил машину самостоятельно создавать переводы для редких языков

erwins22 Dec 19 2016 at 14:02

насколько я понимаю
«если дополнить сугубо лексическую модель еще и моделями морфологии (словоизменение и словообразование) и синтаксиса (построение предложений)» в гугловском переводчике не используется. он примитивнее, Скорее всего ему требуется существенно больше данных, чем подходу гугла…

Как Яндекс научил машину самостоятельно создавать переводы для редких языков

erwins22 Dec 19 2016 at 13:35

только мне кажется этот подход проигрывает гугловскому?

Обертываем алгоритмы в итераторы

erwins22 Dec 19 2016 at 13:33

Там множество комитетов и они фактически независимы.
Вы хотите, что бы был единый комитет согласовывающий все изменения, все нюансы?

Добавление мат функций никак не задерживает процесс принятия других изменений.

Chatbot на базе рекуррентной нейронной сети своими руками за 1 вечер/6$ и ~ 100 строчек кода

erwins22 Dec 16 2016 at 17:54

Вообще на мой взгляд система, что нейронная сеть должна хранить все ответы в себе не верна, она делает сеть переусложенной (в смысле большого количества коэффициентов). Тут есть аналогия между несколькими полносвязными слоями для идентификации изображения и сверточной сетью где только в конце полная.

Тут должна быть аналогия. Сеть должна быть проще, но иметь возможно искать по имеющимся данным включая их в результат. Тут появится возможность исключать редко встречаемые слова которых большинство.

Chatbot на базе рекуррентной нейронной сети своими руками за 1 вечер/6$ и ~ 100 строчек кода

erwins22 Dec 16 2016 at 17:33

Предложения по улучшению.
1. обучение: для фразы используются все предыдущие фразы разговора. Обучение замедлится, но текущая работа не усложниться.
2. Можно использовать несколько проходов туда назад как в переводчике гугла.

Обертываем алгоритмы в итераторы

erwins22 Dec 16 2016 at 16:55

Удивитесь, но она есть и в tensorflow,
Да и добавление математических функций ни у кого не должно вызывать возражений, а так вызов такой функции можно будет эффективно транслировать на графическую карту через OpenAcc.

Яндекс использовал нейросеть и научился прогнозировать осадки с точностью до минут

erwins22 Dec 15 2016 at 10:49

Хотелось бы поподробнее про архитектуру сети.
как и какие слои используются

Яндекс использовал нейросеть и научился прогнозировать осадки с точностью до минут

erwins22 Dec 15 2016 at 10:45

вообще долгосрочные прогнозы это гадание на кофейной гуще.

Например в СССР из за обмеления Каспия собирались поворачивать северные реки, но потом чуток климат изменился и в Каспии уровень воды стал повышаться.
Тоже самое прогнозирование глобального потепления при крупном извержении вулкана может быстро сменится ледниковым периодом с последующим глобальным потеплением.

Агент UNREAL. Нейросеть «фантазирует» о будущем — и обучается быстрее

erwins22 Nov 28 2016 at 10:22

Дота хороша тем, что в ней есть золото причем чем больше его на старте тем нехуже, а значит можно сравнивать рейтинг по золоту…

Агент UNREAL. Нейросеть «фантазирует» о будущем — и обучается быстрее

erwins22 Nov 28 2016 at 09:18

какая фора потребуется игрокам для сравнимой игры? 1000 золота?

Нейросеть Google Translate составила единую базу смыслов человеческих слов

erwins22 Nov 24 2016 at 13:30

Еще интересней, можно ли сделать на таком же принципе трансляцию из одного языка программирования в другой или например в машинные коды? так как тут есть возможность проверять правильность результата и проверять оптимальность(время выполнения)

медленно, но возможно ключевые участки будет иметь определенный смысл.

Нейросеть Google Translate составила единую базу смыслов человеческих слов

erwins22 Nov 24 2016 at 13:24

Интересно, а как смысловые оттенки стран перетекают из одного языка в другой?

грубо говоря возможно ли что в одном языке будет упоминаться одна страна, а в переводе другая?

Нейросеть читает по губам 46,8% слов по телевизору, человек — только 12,4%

erwins22 Nov 22 2016 at 10:30

Есть те кто не врут и они самые опасные

1 2 ...

44 45