Комментарии 15
А без нейросетей задача определения границ документа имеет решения?
В тепличных условиях (однородный контрастный фон) вполне работает детекция границ через преобразования Хафа: быстро и вычислительно просто. Во всех остальных случаях нейросетевые детекторы на порядки лучше.
Я добавлю к ответу @ymn что до введения нейросетей в процессе обработки сканов был этап подготовки перед извлечением данных: уборка мусора (типа дырок от дырокола), исправление искажений, удаление фона цветных документов. Последовательность была такой: сканирование, подготовка, классификация, извлечение (OCR), публикация (вывод данных в поля), валидация оператором, экспорт. С нейросетями этап подготовки стал проще, классификация тоже упростилась.
В универе ("...300 лет тому назад") был курс обработки изображений с практикой. До распознавания академическая задача не доходила, но преобразование Фурье, преобразование Уолша-Адамара на лабах и в курсаче разбирали ... И реализация этого без обсчета на графических ускорителях выполнялась.
Я потому и спросил. По тексту звучало, что мол "нейросети (и чтоб последнего поколения) и чтоб никаких гвоздей".
@stanislawru, кажется где-то у тебя на сайте и сейчас закопаны материалы этих лаб и курсовика
«Закопана» у меня только страница дисциплины «Обработка изображений, распознавание образов и мультимедиа»: https://stanislaw.ru/rus/education/university/subjects.asp?id=images-processing-recognition-multimedia – но там нет лабораторных работ, только курсовая работа, а вот её «закопанной» не назовёшь – до сих пор пользуется популярностью: https://stanislaw.ru/rus/education/university/imagine.asp
За ссылки спасибо. Только комментарий в такой формулировке можно прочитать как "RTFM, нубы! ". Из-за этого восприятия у него и рейтинг в минус пошёл.
Ответили на ваш комментарий в соседней ветке.
так и колесо вроде давно изобрели, а люди все что-то улучшают в способах передвижения. Уверен что ребята из SmartEngine получили не плохой результат для решения задачи в своей постановке, теперь другим нельзя и смотреть в эту сторону?
Не понравилась цена/условия лицензирования?
Здравствуйте! Мы в YADRO постоянно следим за рынком и изучаем различные доступные инструменты. Насколько мы видим, описанное в вашей статье решение основано на классических алгоритмах компьютерного зрения. К слову, коллеги высоко оценивают качество вашего OCR.
Конкретно в этом случае наша инженерная команда, которая работает над ИИ-задачами, приняла решение реализовать собственный продукт.
Сканирование документов на планшетах Kvadra: как мы создавали и обучали алгоритм