Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Зачем тебе база? Можно ведь просто нагенерить картинок с буковками с разными шрифтами и натравить на них аугментацию. Имеет смысл что-то такое искать сразу в виде скрипта, который такую базу нагенерирует.
Вы даже не представляете насколько ваш материал оказался полезен для моего случая. Пишу утилиту для обработки отсканированных чертежей. Бывает по 100+ чертежей в одном скане, и в ручную это все разделять и переименовывать крайне затратно по времени.
Написал код для генерации датасета, чтобы обучить на своих изображениях. А вот с выбором архитектуры возникли сомнения. После вашей статьи стало полностью понятно как действовать дальше.
Python + OpenCV + Keras: делаем распознавалку текста за полчаса