Комментарии 2
Вопрос про другую вашу модель, англо-русскую, почему очень чувствительна к капитализации слов?
Scene Text Recognition with Permuted Autoregressive Sequence Models - Распознавание текста с измененными моделями автоматической регрессии
Scene Text Recognition with permuted autoregressive sequence models - Сценовое распознавание текста с перестановкой моделей авторегрессии
Scene Text Recognition with Permuted autoregressive sequence models - Текстовое распознавание с измененными моделями авторегрессии
Спасибо за вопрос. Правда наверное стоит его в той статье и задавать, уведомления там мне так же приходят.
На самом деле, чувствительна к капитализации как раз по той причине, что в процессе обучения у нас никак не изменяется капитализация слов. В результате для модели слово с большой буквы и с маленький имеет немного различный вес. т.е. если слово с большой буквы, то вероятно модель классифицирует его немного иначе. Ну и в процессе декондинга такое предложение уже имеет другую преплексию, что в целом при лучевом поиске влияет на результат выдачи, модели.
Чтобы этого избежать, необходимо специальным образом обучать модель, чтобы она была менее восприимчива к таким ситуациям.
Первая бесплатная модель перевода с русского на китайский язык и обратно