Обновить
3
0
Антон Ермилов@eran

ML/AI Team Lead

Отправить сообщение

При добавлении нового языка при этом переучиваете модель на всех данных? Вы как-то балансируете данные чтобы при добавлении нового языка модель не забывала старые?

Если вкратце, то "да" и "да". Детальнее — уже особенности внутренней кухни :)

Планируется добавление распознавания этих языков в переводчик?

Переводчик — это отдельный не контролируемый нами сервис Яндекса. Сейчас мы скорее не можем повлиять на добавление распознавания на этих языках в сервис перевода. Но мы передали эту идею коллегам, спасибо!

Не раньше белорусского :)

Сейчас мы используем скорее их комбинацию. Но правила, которые у нас есть, достаточно простые. И они больше применяются либо для исправления проведения сетки там, где она плохо справляется, либо для сбора данных для обучения той же сетки :)

Всё так, размечаются целиком предложения/фразы. Речь скорее шла о нежелательности выбросов на уровне слов. Например, если часть фразы была не размечена или была размечена неправильно

Пока что мы при создании синтеза и распознавания под каждый новый язык смотрим на востребованность этого языка для бизнеса. Следите за новостями, в какой-нибудь момент у нас наверняка появятся синтез и распознавание для белорусского языка, но пока без каких-либо сроков

"... создаём языки..." здесь использовали именно в контексте создания синтеза и распознавания под эти языки. Но согласен, без контекста может звучать странно :)

Что такое олимпиады? Это способность за несколько часов решить несколько мелких задач повышенной сложности. То есть вещи, совершенно оторванные от реальных потребностей индустрии, где как раз требуются продуманные глобальные решения.

Интереса ради, как бы Вы оценивали умение школьников продумывать глобальные решения, требующиеся в индустрии? В этом смысле олимпиады — это не только умение решать задачи «повышенной сложности» (судя по всему, Вы явно недооцениваете их сложность), но и довольно неплохой показатель начальных знаний поступающего.

А вообще, умение быстро придумывать нестандартные решения, проверять различные гипотезы и писать эффективный код — довольно полезная вещь. И в индустрии — в том числе.

Информация

В рейтинге
Не участвует
Откуда
Санкт-Петербург, Санкт-Петербург и область, Россия
Работает в
Дата рождения
Зарегистрирован
Активность