Как стать автором
Обновить

Первая бесплатная модель перевода с русского на китайский язык и обратно

Время на прочтение6 мин
Количество просмотров6.9K
Всего голосов 17: ↑16 и ↓1+15
Комментарии2

Комментарии 2

Вопрос про другую вашу модель, англо-русскую, почему очень чувствительна к капитализации слов?

Scene Text Recognition with Permuted Autoregressive Sequence Models - Распознавание текста с измененными моделями автоматической регрессии

Scene Text Recognition with permuted autoregressive sequence models - Сценовое распознавание текста с перестановкой моделей авторегрессии

Scene Text Recognition with Permuted autoregressive sequence models - Текстовое распознавание с измененными моделями авторегрессии

Спасибо за вопрос. Правда наверное стоит его в той статье и задавать, уведомления там мне так же приходят.

На самом деле, чувствительна к капитализации как раз по той причине, что в процессе обучения у нас никак не изменяется капитализация слов. В результате для модели слово с большой буквы и с маленький имеет немного различный вес. т.е. если слово с большой буквы, то вероятно модель классифицирует его немного иначе. Ну и в процессе декондинга такое предложение уже имеет другую преплексию, что в целом при лучевом поиске влияет на результат выдачи, модели.

Чтобы этого избежать, необходимо специальным образом обучать модель, чтобы она была менее восприимчива к таким ситуациям.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории