Комментарии / Профиль AlexAntonov / Хабр

Александр Антонов @AlexAntonov

Системный аналитик, Руководитель проектов

Профиль Публикации 3Комментарии 7Закладки 32

Выравнивание параллельных текстов для малоресурсных языков

AlexAntonov 4 окт 2021 в 08:32

Сергей, спасибо большое за инструмент

Посмотреть

Обратный перевод для Нейронного машинного перевода

AlexAntonov 27 авг 2020 в 17:57

Интересно! Мы у себя делаем выравнивание вручную, чтобы качество корпуса было выше, а то он итак небольшой

Посмотреть

Обратный перевод для Нейронного машинного перевода

AlexAntonov 26 авг 2020 в 12:37

Дев и тест корпуса автоматически рандомно собрали из ранней версии датасета, когда было еще несколько десятков тысяч предложений. В обучающей выборке их, конечно, нет. Хотя мы осознаем, что они далеки от идеала). На самом деле абсолютные значения BLEU практически ничего не значат, важнее сравнение их между собой, примерно +2-3 BLEU видно глазами, но тоже не 100% правило. Вот к примеру тут github.com/masakhane-io/masakhane-mt/tree/master/benchmarks/en-yo/jw300-baseline обучение на автоматически выровненных данных, то есть на более грязном корпусе, и тоже высокие показатели, причем тест лучше, чем дев существенно.

Посмотреть

Обратный перевод для Нейронного машинного перевода

AlexAntonov 25 авг 2020 в 20:58

Именно так не пробовал. Записал себе идею на посмотреть) Из относительно похожего сейчас рекомендуют копать в сторону github.com/facebookresearch/XLM

Посмотреть

Передача знания и Нейронный машинный перевод на практике

AlexAntonov 29 ноя 2019 в 18:55

BPE считается в пределах одной минуты. То есть это не узкое место в процессе. Версию, которые вы предложили, не смотрел, спасибо за ссылку.

rouge считать sockeye умеет, но я на него не смотрю: принимаю по bleu и по визуальному сравнению. Проверил по логам: на валидации растет примерно с 0.38 до 0.47

Посмотреть

Kaggle – наша экскурсия в царство оверфита

AlexAntonov 8 авг 2016 в 15:27

На тренировочной и тестовой выборках у вас получались схожие результаты, когда уже оказались в первой сотне? Касательно слова «оверфит» в названии статьи и склеивания полукартинок… В этом плане синтетически увеличить тренировочный набор — очень интересная идея. Можно понять, есть ли склонность алгоритма к оверфиту. И если всё хорошо, то дообучить. Интересно было бы посмотреть, что даст склеивание четвертинок и далее

Посмотреть

Математика для искусственных нейронных сетей для новичков, часть 1 — линейная регрессия

AlexAntonov 3 авг 2016 в 13:53

Интересная статься. Только надо наверно более явно обозначить, что цикл про НН, а конкретно данная статья всё-таки про линейную регрессию.

Посмотреть