Pull to refresh

Comments 27

Зачем такие сложности для распознавания такой лёгкой капчи?

Можно сделать значительно проще. Когда выделили блок цифры, делите на четыре части и считаете количество черных точек в каждой части + общее количество черных точек. У каждой цифры своё соотношение количества точек 4 частей и общее количества точек.
Это стандартный приём. Для не пересекающихся цифр имеет большой коэффициент угадывания. При хорошей отладке и увеличение дробления блока цифры (не 4 части, а 9) достаточно хорошо распознаёт искажённые и повёрнутые (не более 30 градусов) цифры.
На тот момент это было самое простейшее, ибо время было ограничено. Я как бы не вижу сложностей в таком подходе. Реально первые два этапа сложились в 10-20 минут попивая кофе. Остальное кодилось где-то за полчаса/час в неспешном режиме на простейших функциях
Это, конечно, хорошо, но капча ведь вообще какая-то левая.
Пусть есть капча выдаваемая по адресу cracks.ms/check_image.php?id=N
Удалим из N все цифры, большие 5.
Ответом на капчу будет полученное число, переведённое из шестеричной в девятеричную систему счисления.
Тогда я только начинал изучать C# ))) Это был практически первый проект и мне нужно было пройтись именно по работе с изображениями. Тем более, что приведенный класс решал еще две капчи )
Что, кстати, объясняет отсутствие цифры 9 среди присутствующих в капче. А можно поинтересоваться, как вы алгоритм получили? Подбором?
Отсутствие цифр 6-9 обусловлено тем, что это генератор каптчи из чисел в шестеричной системе счисления.
отсутствует только цифра 9
Давайте так. Когда я писал программу, я думал только о том, как разобрать именно изображение. Когда я писал статью — я написал для тех, кому интересен разбор такого вида задачек, впринципе я знал о варианте без перебора изображения, что в принципе я и пытался указать фразой «МНОГОЕ можно оптимизировать, но это уже задачка вам, если конечно интересно :)»

По поводу девятеричной системы я в курсе, что это такое.
Прошу прощения, я просто не сразу понял, что Вы своим постом хотели сказать, что «цифра 6 присутствует», не то, что «девятка отсутствует». Ох уж этот великий и могучий :)
та не, мужчина, не парься, тебя не ругают, просто парни похакали капчу на самом деле, а твоя статья полезная
та я не парюсь. мне интересны конструктивные замечания, как, например, первый комментарий. а в остальном, если хоть одному человеку это поможет, я уже буду рад, свою миссию я выполнил :)
Сначала вбил большое N, понял что капча от него прямо зависит, потом посмотрел поведение на маленьких и всё понятно стало.
А мне вот интересно какой смысл качать файлы с сайта cracks.ms? Вы же наверное массу вирусов себе накачали.
Не я их качал. Меня попросили написать софт чтобы их качал и вирусов не поверите, ни одного не словили. Я увлекался изучением вирусов тогда и новая тушка в коллекцию не помешала бы.
Схожим способом распознавал капчу hid24, правда делал это на пхп. Если интересно — скину ссыль на код.
>Кто работал с ассемблером на 8086 и делал маски символов меня поймет
Ээээ… Работа с битами вообще-то является основой для КАЖДОГО программиста, независимо от того, слышал он про ассемблер 8086 или нет.
Я подразумевал несколько иное :) Когда загружались символы с помощью того же кейрус — они загружались именно такой маской, насколько я помню.
Ээээ… правда чтоли? о_О

Я даже не знаю в чем разница между положительными и отрицательными числами… ужас…

Как я могу работать без этого в Javasctipt!!! Увольняюсь немедленно с работы!!!
А можно посмотреть на ваши творения? Мне правда интересно, КАК вы пишете.
Напишите статью «Динамический банер на дотнете»
А каптчу ломать — задача сложная и чото ее никто осилить не может.
А исходнички не покажите, проги которая собирала инфу? если не хотите всем — можно на мыло.
Что именно вас интересует? Проход по сайту или именно проход данного конкретного сайта с выкачиванием информации? Я просто думал, если никто еще не писал — написать статейку о том, как сканировать сайт, как работать с get-post запросами и проч. Скажем сейчас таким образом работаю с кинопоиском
Инетерсует как взять с сайта какую-нибудь информацию, пусть теже картинки, или же там, текст дергать. Вобщем как написать програмулину которая могла бы дергать с сайта инфу (пусть теже капчи, что угодно). Проход сайта с выкачиванием инфы… самое то)
Sign up to leave a comment.

Articles