Comments / Profile of AlexAntonov / Habr

Александр Антонов @AlexAntonov

Системный аналитик, Руководитель проектов

Profile Publications 3Comments 7Bookmarks 32

Выравнивание параллельных текстов для малоресурсных языков

AlexAntonov Oct 4 2021 at 08:32

Сергей, спасибо большое за инструмент

Look

Обратный перевод для Нейронного машинного перевода

AlexAntonov Aug 27 2020 at 17:57

Интересно! Мы у себя делаем выравнивание вручную, чтобы качество корпуса было выше, а то он итак небольшой

Look

Обратный перевод для Нейронного машинного перевода

AlexAntonov Aug 26 2020 at 12:37

Дев и тест корпуса автоматически рандомно собрали из ранней версии датасета, когда было еще несколько десятков тысяч предложений. В обучающей выборке их, конечно, нет. Хотя мы осознаем, что они далеки от идеала). На самом деле абсолютные значения BLEU практически ничего не значат, важнее сравнение их между собой, примерно +2-3 BLEU видно глазами, но тоже не 100% правило. Вот к примеру тут github.com/masakhane-io/masakhane-mt/tree/master/benchmarks/en-yo/jw300-baseline обучение на автоматически выровненных данных, то есть на более грязном корпусе, и тоже высокие показатели, причем тест лучше, чем дев существенно.

Look

Обратный перевод для Нейронного машинного перевода

AlexAntonov Aug 25 2020 at 20:58

Именно так не пробовал. Записал себе идею на посмотреть) Из относительно похожего сейчас рекомендуют копать в сторону github.com/facebookresearch/XLM

Look

Передача знания и Нейронный машинный перевод на практике

AlexAntonov Nov 29 2019 at 18:55

BPE считается в пределах одной минуты. То есть это не узкое место в процессе. Версию, которые вы предложили, не смотрел, спасибо за ссылку.

rouge считать sockeye умеет, но я на него не смотрю: принимаю по bleu и по визуальному сравнению. Проверил по логам: на валидации растет примерно с 0.38 до 0.47

Look

Kaggle – наша экскурсия в царство оверфита

AlexAntonov Aug 8 2016 at 15:27

На тренировочной и тестовой выборках у вас получались схожие результаты, когда уже оказались в первой сотне? Касательно слова «оверфит» в названии статьи и склеивания полукартинок… В этом плане синтетически увеличить тренировочный набор — очень интересная идея. Можно понять, есть ли склонность алгоритма к оверфиту. И если всё хорошо, то дообучить. Интересно было бы посмотреть, что даст склеивание четвертинок и далее

Look

Математика для искусственных нейронных сетей для новичков, часть 1 — линейная регрессия

AlexAntonov Aug 3 2016 at 13:53

Интересная статься. Только надо наверно более явно обозначить, что цикл про НН, а конкретно данная статья всё-таки про линейную регрессию.

Look