Как стать автором
Обновить

Комментарии 10

Весьма интересная статья, спасибо

Спасибо за проявленный интерес к статье

Нет, не пользовался данной библиотекой, но есть много способов сравнивать изображения, указанный вами один из них, нужно пробовать. Также можно обратить внимание на библиотеку face_recognition, которая написана на основе библиотеки dlib – удобная библиотека для распознавания лиц

Я имел в виду функцию потерь https://arxiv.org/abs/1801.07698 , которая позволяет разместить векторы фич на гиперсфере. Она хорошо с некоторыми классами работает.

Правда, обычно ее используют для объектов одного класса с целью идентификации. Я и подумал, может быть вы это использовали для улучшений.

В качестве функции потерь тоже не использовал, но думаю можно пробовать и экспериментировать.

А если есть задача поиска текста на изображении, при условии что сам текст не важен, то что будет выгоднее по ресурсам, прогонять изображение через ocr или научить искать буквы методом, как в статье?

Думаю удобнее будет использовать OCR, т.к. данная программа предназначена для поиска текста. Метод, указанный в статье, также можно попробовать использовать, но это будет затратнее по времени, т.к. нужно будет самому продумывать структуру построения модели, в то время как OCR – готовый продукт. Также если текст находится в pdf-сканах можно попробовать предобработать их при помощи программ AbbyFineReader или HotFolder, в которых также есть способы поиска текста на изображении

Все OCR плоховато распознают текст написанный под углом или как-то еще, а есть такая задача, вот и интересуюсь

Посмотрите в сторону решений готовых программ по типу AbbyFineReader и HotFolder. Например, при помощи этих программ можно правильно ориентировать изображение, т.е. текст будет без наклонов, а дальше использовать уже OCR или tesseract или решение, представленное в статье

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации