Pull to refresh

Comments 2

Вопрос про другую вашу модель, англо-русскую, почему очень чувствительна к капитализации слов?

Scene Text Recognition with Permuted Autoregressive Sequence Models - Распознавание текста с измененными моделями автоматической регрессии

Scene Text Recognition with permuted autoregressive sequence models - Сценовое распознавание текста с перестановкой моделей авторегрессии

Scene Text Recognition with Permuted autoregressive sequence models - Текстовое распознавание с измененными моделями авторегрессии

Спасибо за вопрос. Правда наверное стоит его в той статье и задавать, уведомления там мне так же приходят.

На самом деле, чувствительна к капитализации как раз по той причине, что в процессе обучения у нас никак не изменяется капитализация слов. В результате для модели слово с большой буквы и с маленький имеет немного различный вес. т.е. если слово с большой буквы, то вероятно модель классифицирует его немного иначе. Ну и в процессе декондинга такое предложение уже имеет другую преплексию, что в целом при лучевом поиске влияет на результат выдачи, модели.

Чтобы этого избежать, необходимо специальным образом обучать модель, чтобы она была менее восприимчива к таким ситуациям.

Sign up to leave a comment.

Articles