Как стать автором
Обновить

Сканирование документов на планшетах Kvadra: как мы создавали и обучали алгоритм

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров1.8K
Всего голосов 20: ↑20 и ↓0+26
Комментарии15

Комментарии 15

А без нейросетей задача определения границ документа имеет решения?

В тепличных условиях (однородный контрастный фон) вполне работает детекция границ через преобразования Хафа: быстро и вычислительно просто. Во всех остальных случаях нейросетевые детекторы на порядки лучше.

Спасибо, плюсанул бы комментарий, но мне похоже за этот заданный вопрос слили карму 😁

Я добавлю к ответу @ymn что до введения нейросетей в процессе обработки сканов был этап подготовки перед извлечением данных: уборка мусора (типа дырок от дырокола), исправление искажений, удаление фона цветных документов. Последовательность была такой: сканирование, подготовка, классификация, извлечение (OCR), публикация (вывод данных в поля), валидация оператором, экспорт. С нейросетями этап подготовки стал проще, классификация тоже упростилась.

В универе ("...300 лет тому назад") был курс обработки изображений с практикой. До распознавания академическая задача не доходила, но преобразование Фурье, преобразование Уолша-Адамара на лабах и в курсаче разбирали ... И реализация этого без обсчета на графических ускорителях выполнялась.

Я потому и спросил. По тексту звучало, что мол "нейросети (и чтоб последнего поколения) и чтоб никаких гвоздей".

«Закопана» у меня только страница дисциплины «Обработка изображений, распознавание образов и мультимедиа»: https://stanislaw.ru/rus/education/university/subjects.asp?id=images-processing-recognition-multimedia – но там нет лабораторных работ, только курсовая работа, а вот её «закопанной» не назовёшь – до сих пор пользуется популярностью: https://stanislaw.ru/rus/education/university/imagine.asp

Коллеги, предлагаем вам изучить отечественные журналы или хотя бы хабр :)

С наилучшими пожеланиями,

команда Smart Engines

За ссылки спасибо. Только комментарий в такой формулировке можно прочитать как "RTFM, нубы! ". Из-за этого восприятия у него и рейтинг в минус пошёл.

Друзья, а можно последнюю просьбу? Немного оффтоп, но прошу простить меня как нечастого гостя Хабра 😄

Ответьте в личку : за какой именно комментарий снизили карму?

ребята такое сделали ещё 9 лет назад, а вот они же на квадре давно работают.

зачем поделки разводить, если до вас уже все сделали?

так и колесо вроде давно изобрели, а люди все что-то улучшают в способах передвижения. Уверен что ребята из SmartEngine получили не плохой результат для решения задачи в своей постановке, теперь другим нельзя и смотреть в эту сторону?

Не понравилась цена/условия лицензирования?

Здравствуйте! Мы в YADRO постоянно следим за рынком и изучаем различные доступные инструменты. Насколько мы видим, описанное в вашей статье решение основано на классических алгоритмах компьютерного зрения. К слову, коллеги высоко оценивают качество вашего OCR.

Конкретно в этом случае наша инженерная команда, которая работает над ИИ-задачами, приняла решение реализовать собственный продукт.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий