Kelenius Jan 6 2013 at 13:01

Прохождение капчи «Лабиринт» на Javascript

5 min

13K

JavaScript *

From sandbox

+15

Comments 16

datacompboy Jan 6 2013 at 13:10

Глянул приведённые примеры — глазами проходится за 10-15 секуд… Но таки да, за такие капчи надо отрывать и userscript'ы делать. Из вредности.

Kelenius Jan 6 2013 at 14:01

В спокойной ситуации — да. Но есть нюансы. Например, можно переключиться на другую вкладку пока страница грузится и не заметить, что капча появилась. Или изображение может отказаться загружаться, пока не обновить страницу. Можно просто затупить и запутаться в лабиринте. Способов не уложиться в 20 секунд — масса.

Ну и потом, после первой сотни проходить эти лабиринты надоедает.

SnakeSolid Jan 6 2013 at 14:56

Интересный способ поиска свободных клеток. Когда я посмотрел лабиринты мне пришел в голову такой вариант:

Дано:
1. свободные клетки всегда ярче;
2. треугольники, как я понимаю, всегда проходят диагонально через центр;
3. вокруг лабиринта всегда есть непроходимая граница.

Алгоритм:
1. выбираем четыре заведомо занятых клетки для каждого из направлений (север, юг, запад, восток) не зависимо от наличия треугольников;
2. находим для каждой из них средний цвет;
3. в цикле сравниваем (яркость заведомо непроходимой клетки (из 2) + порог) и (яркость определяемой клетки) если яркость проверяемой клетки больше тогда она проходима, иначе это стена.

Порог подбирается эмпирически.

Kelenius Jan 6 2013 at 17:09

Это интересный вариант. Наверное, тогда лучше сравнивать не яркость, а просто сумму разностей по трём цветам (или сумму квадратов разностей). А можно выбрать заведомо занятую клетку и заведомо свободную, и смотреть, на какую из них проверяемая больше похожа. Если бы цвет дорожек менялся, наверное, стоило бы использовать одно из этих решений.

vbif Jan 6 2013 at 22:14

Да уж, отличный пример того, как не надо делать капчу.

vilky Jan 7 2013 at 05:26

Я понимаю, что это уже за пределами задачи, которую вы решаете в статье, но это так звучит… Вы играете в «простую и монотонную» игру, а когда в ней открывается вставная игра, «нетривиальная», даёте её пройти скрипту.

spiritedflow Jan 7 2013 at 08:47

И эту капчу надо время от времени проходить? Они, наверное, хотели, чтобы остались одни боты, а не игроки.

Keenest Jan 7 2013 at 09:07

Это тонкий ход — дать возможность программистам и поиграть, и подзаработать (продавая скрипты игрокам).
А там, глядишь, авторов лучших скриптов и на работу позовут, хех.

iFrolov Jan 8 2013 at 04:50

Авторам следовало бы делать эти треугольники градиентами, тогда бы было веселее. Да и сами лабиринты делать кривыми, это гораздо забавнее, хотя и нагрузит сервер сильнее.

Автору топика же я порекомендую почитать про бинаризацию и алгоритм «волна», а то мое естество всячески протествовало во время чтения от увиденного кода

YUVladimir Jan 8 2013 at 08:05

Все можно сделать гораздо проще — беглый взгляд на картинку показывает, что цвет элементов лабиринта не меняется при наложении треугольников, меняется лишь яркость. Поэтому первый этап — преобразуем картинку в цветовое пространство Lab по формулам:

Для примера, возьмем эту картинку:

Выделяем канал b:

Простейшая фильтрация и пороговая обработка:

Далее заливка любым FloodFill алгоритмом с входа и получаем конечный результат:

pxx Jan 8 2013 at 14:17

Идея классная, но не лишена нюансов. Вы взяли одну конкретную картинку и на ее основе построили рабочую математическую модель. Но если глянуть шире, то уже даже на 6 тестовых примерах из статьи выходит не всё так радужно.

Канал a:

Канал b:

Нужно выбирать наиболее контрастный, нужно подбирать порог… Например на пятой не хватает контраста ни в одном из каналов.

YUVladimir Jan 8 2013 at 15:20

Да, все примеры, за исключением пятого вполне неплохо преобразовались. Что уже дает весьма хорошую точность распознавания. А выбор одного из двух каналов можно сделать просто — прогнать алгоритм на обоих и посмотреть площадь залитой зоны — там где она относительно небольшая, то и считать нормальным.
Порог выбирается также практически любым алгоритмом бинаризации — на таких картинках должен хорошо работать

iFrolov Jan 8 2013 at 16:42

Попробовал своим фильтром бинаризации и был очень удивлен, когда получил голый шум. Я правда выбирал значения по наибольшему компоненту в RGB, отсюда оно и шумит, пытается сохранить максимум деталей и в результате голый шум. Блюр (на картинке в углу) тоже не слишком помог. Впрочем, фильтр я делал для книжек больше, на них он работает идеально.

YUVladimir Jan 9 2013 at 10:41

Можно даже попробовать использовать один из многих алгоритмов адаптивной (динамической) бинаризаци.
Вот пример описания: it-claim.ru/Library/Books/ITS/wwwbook/ist4b/its4/fyodorov.htm
И пара примеров работы с той статьи:

iFrolov Jan 10 2013 at 00:08

Ну мой фильтр попроще, без подавления шума, однако тоже динамический:

Собственно, шум — это тоже детали, а именно для сохранения деталей я его и делал.

YUVladimir Jan 10 2013 at 05:11

Если шум мешает, изображение перед бинаризацией надо обрабатывать — хотя бы медианным фильтром для начала