Комментарии 6
Появилось масса вопросов, но большинство задам в личку, если можно. Из того что, как я думаю, будет интересно окружающим - во что обошлась эта работа в плане серверных мощностей? И есть ли у компании интерес к другим языкам народов России?
Как понять что статья написана роботом? Слово Выводы выдает робота, оно прямо глаза мозолит.
Некоторые словосочетания режут глаз. Месяц работы, скорее всего, сказывается.
Интересно, как ваш ИИ поймёт такое словосочетание на татарском, как «Малай кара». ИИ, с которыми я пробовал, не очень справляются, и переводчики не совсем корректно переводят.
tl;dr: так мало ресурсов было, очень мало. мтс никого не дал. обучили kotype на переведённых датасетах. очень мало ресурсов было, было очень сложно
Вы же в курсе, что так-то собраны огромные корпуса татарских текстов в машиночитаемой разметке, придумывать переводом ничего не нужно? )
А как вы проверяли качество перевода, участвовали ли в этом профессиональные переводчики/лингвисты(носители языка - это совсем другое). Уже в первом чате видны ошибки...
Как за месяц научить нейросеть говорить на татарском: опыт MTS AI