Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Я бы скорее думал в сторону учета контекста соседних символов. И это идеологически очень похоже на работу GPT, как угадывание на основе серии данных на входе. Но входным токеном будет не слово, а визуальный глиф.
Для обучения такой сети можно использовать дистилляцию с умных моделей - примерно также, как вы и OCR обучаете.
Что будет, если пригласить на свидание OCR и GPT?