NewTechAudit6 дек 2022 в 10:28

Как найти и сравнить похожие изображения автоэнкодером

10 мин

13K

Машинное обучение * Обработка изображений * Python * Программирование *

Туториал

Комментарии 10

mrkaban 6 дек 2022 в 10:48

Весьма интересная статья, спасибо

NewTechAudit 6 дек 2022 в 10:54

Спасибо за проявленный интерес к статье

xaoc80 6 дек 2022 в 21:32

Вы не пробовали использовать что-то на подобии arcface с последующей tSNE в конце?

NewTechAudit 7 дек 2022 в 08:05

Нет, не пользовался данной библиотекой, но есть много способов сравнивать изображения, указанный вами один из них, нужно пробовать. Также можно обратить внимание на библиотеку face_recognition, которая написана на основе библиотеки dlib – удобная библиотека для распознавания лиц

xaoc80 7 дек 2022 в 10:05

Я имел в виду функцию потерь https://arxiv.org/abs/1801.07698 , которая позволяет разместить векторы фич на гиперсфере. Она хорошо с некоторыми классами работает.

Правда, обычно ее используют для объектов одного класса с целью идентификации. Я и подумал, может быть вы это использовали для улучшений.

NewTechAudit 8 дек 2022 в 02:20

В качестве функции потерь тоже не использовал, но думаю можно пробовать и экспериментировать.

RedPandaHere 7 дек 2022 в 08:05

А если есть задача поиска текста на изображении, при условии что сам текст не важен, то что будет выгоднее по ресурсам, прогонять изображение через ocr или научить искать буквы методом, как в статье?

NewTechAudit 7 дек 2022 в 08:08

Думаю удобнее будет использовать OCR, т.к. данная программа предназначена для поиска текста. Метод, указанный в статье, также можно попробовать использовать, но это будет затратнее по времени, т.к. нужно будет самому продумывать структуру построения модели, в то время как OCR – готовый продукт. Также если текст находится в pdf-сканах можно попробовать предобработать их при помощи программ AbbyFineReader или HotFolder, в которых также есть способы поиска текста на изображении

RedPandaHere 7 дек 2022 в 11:35

Все OCR плоховато распознают текст написанный под углом или как-то еще, а есть такая задача, вот и интересуюсь

NewTechAudit 8 дек 2022 в 11:53

Посмотрите в сторону решений готовых программ по типу AbbyFineReader и HotFolder. Например, при помощи этих программ можно правильно ориентировать изображение, т.е. текст будет без наклонов, а дальше использовать уже OCR или tesseract или решение, представленное в статье

Зарегистрируйтесь на Хабре, чтобы оставить комментарий