atomnijpchelovek5 дек 2023 в 12:55

Один бот против тысяч мемов, или как я создал бота-полицейского для мем-чата

Простой

7 мин

6.7K

Python * Обработка изображений *

Кейс

Комментарии 6

mallo_c 5 дек 2023 в 13:54

Мне кажется, можно просто Tesseract'ом распознавать текст и искать подобный. Если отличается на 3-4 слова, то это случай 3 (крохотные отличия). Если совсем не похоже (тут лучше смотреть по семантике, в отличие от случая 1), то это случай 1 (скриншоты из твиттера). Если почти одно и то же, но не сл. 3, то это сл. 2.
Правда, будет бесполезен при бестекстовых мемах.

atomnijpchelovek 6 дек 2023 в 00:21

Интересный вариант, никогда раньше им не пользовался. Думаю, если будет видно, что продолжаются ложные срабатывания на текстовых мемах - добавлю дополнительную проверку

SnakeSolid 5 дек 2023 в 15:27

А вы не пробовали использовать SIFT дескрипторы чтобы сравнивать картинки? На подобных задачах они должны хорошо работать заодно позволяют визуализировать за что цепляется алгоритм в отличие от нейросетей.

atomnijpchelovek 6 дек 2023 в 00:25

Не пробовал. Добавил в список на почитать. Быстрый поиск находит PythonSIFT, обязательно затестирую и дам апдейт в статью, как он себя показал

AWRDev 6 дек 2023 в 05:03

Тоже начал делать такое, в планах было прийти и пройти и Ваши шаги. Однако начал только со сравнения текстов с помощью шинглов. Честно изучу и скоммунижу ваши наработки)

atomnijpchelovek 6 дек 2023 в 12:20

Если руки дойдут, то потом опубликую полный код бота апдейтом в пост, забирайте на здоровье)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий