Как стать автором
Обновить

Первый нейросетевой переводчик для эрзянского языка

Время прочтения 10 мин
Просмотры 8.2K
Семантика *Data Mining *Машинное обучение *Искусственный интеллект Natural Language Processing *
⚒️ Cезон Data Mining

Эрзянский язык из финно-угорской семьи – один из официальных в республике Мордовия, и на нём говорят сотни тысяч людей, но для него до сих пор не было почти никаких технологий машинного перевода, кроме простых словарей.
Я попробовал создать первую нейросеть, способную переводить с эрзянского на русский (и с натяжкой ещё на 10 языков) и обратно не только слова, но и целые предложения.

Пока её качество оставляет желать лучшего, но пробовать пользоваться уже можно.
Как я собирал для этого тексты и обучал модели – под катом.

Читать далее
Всего голосов 70: ↑69 и ↓1 +68
Комментарии 20