«Яндекс» в 2024 году запустит языковую модель YandexGPT, которая умеет писать и перерабатывать тексты на казахском языке, запоминать ход беседы и отвечать на уточняющие вопросы пользователя. YandexGPT станет первой публичной генеративной нейросетью, специально обученной понимать казахский язык и говорить на нём.
Нейросеть будет доступна пользователям через виртуального ассистента в приложении «Яндекс», а также в «Поиске» и «Яндекс Браузере» в Казахстане.
Также на облачной платформе Yandex Cloud планируется запуск коммерческой версии YandexGPT на казахском для бизнеса. Она позволит казахстанским компаниям и разработчикам развивать продукты и сервисы на основе генеративных нейросетей.
За основу взяли базовую модель YandexGPT. Для её дообучения на первом этапе подготовили сотни тысяч запросов и ответов на казахском языке, охватывающих различные темы и контексты бесед. Это обеспечивает модели необходимую основу для понимания языка и культурного кода.
В обучении нейросети участвуют AI‑тренеры «Яндекс Казахстан». Они оценивают ответы нейросети — точность, полноту, фактическую правильность, грамматику и стиль — и пишут эталонные запросы и ответы на казахском языке. Затем на них обучают нейросеть и таким образом повышают точность её ответов.