Comments 6
Публичный API будет?
Крутая разработка. Интересно было читать.
1. Так на вход подаются картинки одинакового размера? т.е. LSTM тут не обязателен?
2. Если вы делали end-to-end то почему же сразу не сделали картинка->текст?
2. Если вы делали end-to-end то почему же сразу не сделали картинка->текст?
А не сравнивали ваше решение с конкурентами или аналогами (ABBYY FineReader, Tesseract, например)?
Было бы здорово видеть не только разницу двух новых подходов, но и более широкую картину.
Sign up to leave a comment.
Сегментация текстовых строк документов на символы с помощью сверточных и рекуррентных нейронных сетей