Pull to refresh
604.74
Яндекс
Как мы делаем Яндекс

Яндекс представил новую версию машинного перевода, обученную с помощью YandexGPT

Reading time2 min
Views4.2K

Мы впервые применили большую языковую модель YandexGPT для подготовки эталонных примеров текстов, на которых затем обучили нейросеть в Яндекс Переводчике. Это позволило сервису точнее понимать контекст, распознавать фразеологизмы и ориентироваться в профессиональной лексике.

Переводчик стал качественнее справляться с длинными и сложными текстами. Благодаря дообучению он лучше определяет взаимосвязи внутри предложений и между ними. Кроме того, выросло качество перевода статей узконаправленной тематики. Например, сервис теперь поймёт по контексту, что речь идёт о языке программирования или фондовом индексе, и оставит их названия без перевода.

Зачем мы обучали нейросеть в Переводчике с помощью YandexGPT

Яндекс использует технологию машинного перевода на основе нейросетей с 2018 года: есть даже статья на Хабре в нашем блоге. Нейросеть в Переводчике обучается на парах текстов — оригиналах и их переводе на другой язык. Так она учится видеть взаимосвязи между ними и подражать им. Причём это очень быстрая, легковесная нейросеть: это позволяет ей справляться с большим количеством пользовательских запросов в реальном времени.

Большая языковая модель YandexGPT требует больше ресурсов, работает медленнее, но зато способна генерировать сложные, лексически и стилистически разнообразные тексты, в том числе со специфической терминологией. Поэтому мы применили её для создания эталонных примеров, чтобы расширить датасет и повысить его качество. Так более лёгкая нейросеть в Переводчике, обученная на новом датасете, не потеряла в скорости, но стала умнее.

Как мы обучали специальную версию YandexGPT

Для генерации эталонных обучающих примеров мы разработали специализированную модель семейства YandexGPT, адаптировав её под задачи перевода. Сначала модель на этапе предобучения (pretraining) проанализировала множество текстов на английском и русском языках и изучила правила лексики, морфологии и синтаксиса.

Следующим этапом шла тонкая настройка языковой модели (supervised finetuning) под задачи перевода. Затем на этапе обучения с подкреплением (reinforcement learning) AI‑тренеры оценивали качество перевода YandexGPT и ранжировали её ответы от лучших к худшим. Кстати, об особенностях работы с reinforcement learning мы тоже недавно писали.

Благодаря всем этим этапам мы создали модель YandexGPT, которая генерирует наиболее качественные примеры для дальнейшего обучения нейросети Переводчика.

Как мы оценивали качество

Работу дообученной нейросети в Переводчике мы оценивали методом Side by Side (SbS). Асессоры, владеющие русским и английским языком, сравнивали пары длинных и сложных текстов, переведённых с помощью двух версий технологии, и выбирали лучший вариант. В 57% случаев новая версия справлялась лучше.

Обновлённая технология уже используется для перевода текстов с английского на русский язык в Яндекс Переводчике, Поиске, а также в переводе видео в Браузере.

Tags:
Hubs:
Total votes 12: ↑12 and ↓0+18
Comments14

Useful links

Яндекс запустил Нейро. Рассказываем, как он работает

Level of difficultyMedium
Reading time14 min
Views64K
Total votes 92: ↑82 and ↓10+91
Comments143

Как мы научили YandexGPT пересказывать видео

Level of difficultyMedium
Reading time14 min
Views16K
Total votes 63: ↑63 and ↓0+63
Comments63

YandexGPT в Алисе: как мы создаём языковую модель нового поколения

Reading time7 min
Views45K
Total votes 52: ↑49 and ↓3+61
Comments82

Information

Website
www.ya.ru
Registered
Founded
Employees
over 10,000 employees
Location
Россия