Как стать автором
Обновить

Комментарии 8

Видел ваше видео в виде гифки в соц.сетях. Пока не увидел в хорошем качестве, полагал, что изобретение заморское, и мы никогда не узнаем, что там за кулисами.
Немного расстроен статьёй, очень много времени уделено рутинным вопросам, которые можно было решить на порядок проще. И, видимо, мало времени осталось на рассказ о сути вопроса. Я когда начинал читать статью был уверен, что вы для резанных картинок примените алгоритм склеивания, но о нём в конце одна строчка.
По рутинным вопросам. В основе проекта надо было использовать Selenium, чтобы взаимодействовать не с «картинкой, на которой браузер в котором картинка, которую нужно распознать», а с HTML-кодом, в котором всё лежит в виде объектов и со ссылками на ресурсы. Там лежит текст задания и можно извлечь все координаты квадратов или сразу сделать скриншот нужной части экрана. В таком случае псевдоалгорим следующий:
получаем текст задания
если отдельные картинки с образами:
    перебираем каждую, выбираем 3 наиболее вероятных варианта, отмечаем
    далее перебираем только эти 3 квадрата, пока на них есть образы
если картинка с общим образом:
    извлекаем картинки и собираем, например, в imagemagick
    находим образ, получаем средние координаты щелчков
    отмечаем
А люди тем временем всё сильнее матерятся, пытаясь отличить витрину от дымовой трубы.
Ну сейчас уже рекаптча-3 работает по-другому. Но ее также быстро кто-то сломал. Правда с низким рейтингом = 0,1. Приходится не пропускать пользователей с рейтингом 0,1. Но под запрет попадают реальные пользователи т.к. рейтинг 0,1 имеют многие пользователи которые впервые зашли на сайт. Как ее ломают остается загадкой. Однако от рекаптчи мирового лидера хотелось бы большего.
Немного вызывает вопрос почему нельзя задать необходимость точного совпадения ip адреса. ip адрес является опциональным параметром, но даже если его явно задать то не будет ошибки если ip адрес не совпадает. Просто понизится рейтинг или будут на этот адрес более сложные картинки отображать.

Интересная статья.
Как дальнейший вариант развития капчи, гуглу стоит добавлять артефакты на изображения, которые будут ломать нейросети.
Пример реализации хорошо описан здесь:
https://m.habr.com/en/post/405773/

уже
image
Чтобы улучшить качество распознавания скриншотов интерфейсов у Tesseract-OCR (3 версии) пришел к 3-м шагам.

1. В настройках указать только символы кириллического алфавита (tessedit_char_whitelist)
2. По возможности отключить встроенные словари и использовать только белый список слов (load_system_dawg=F load_freq_dawg=F language_model_penalty_non_dict_word=100)
3. Обработать изображение через pixConvertRGBToLuminance из leptonica (неожиданно, но это работает — непонятно почему) и задать полученному изображению dpi=192 через pixSetResolution (опять загадка, ибо четче от этого картинка не станет)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации