Pastafarianist25 мар 2011 в 18:37

Распознавание некоторых современных CAPTCHA

15 мин

80K

Python * Алгоритмы * Обработка изображений *

Из песочницы

+306

148

Комментарии 148

snizovtsev 25 мар 2011 в 18:49

Спасибо, отличная статься!
p.s. пошёл настраивать sms уведомления об поступивших email (оператор red).

Pastafarianist 25 мар 2011 в 19:10

Научите?

librarian 25 мар 2011 в 19:32

C моим, относительно небольшим количеством email, меня бы быстро задолбало. А их всего то порядка сотни-полутора в день.

Error_403_Forbidden 25 мар 2011 в 20:32

Не забудь запастить списком качественных прокси, иначе сразу забанят.
Проверено.

qweewq 26 мар 2011 в 16:02

Напишите статью ;)

link0ln 28 мар 2011 в 04:43

ээмм, велосипеТ. Я пользуюсь услугой е-майл на смс. Услуга бесплатна. Я живу на урале и мой почтовый смс ящик вида 7XXXXXXXXXX@sms.ural.mts.ru. В интернет помощнике можно подключить также бесплатно.
А за статью автору спасибо огромное!
ps: в моду входят капчи вот такого вида как здесь keycaptcha.com, как говорится «а вам слабо» ;)

SSar 28 мар 2011 в 05:51

Не у всех операторов и не во всех регионах работают почтовые шлюзы.
Многие пашут только в Москве/Питере, некоторые операторы данную услугу включают по заявлению, порой даже за $$.

link0ln 28 мар 2011 в 06:04

хм, возможно, спорить не стану… но опять же… в таком случае ~50% распознавание не думаю что устроит вас при работе с пересылкой уведомлений, вариант только если отслеживать результат ввода.

SSar 28 мар 2011 в 06:57

Я уже задавал этот вопрос общественности на хабре:
Подскажите шлюзы EMAIL->SMS для различных операторов и/или сервисы по отправке SMS для физ.лиц

Smi1e 25 мар 2011 в 19:06

Никогда не приходило в голову, что все наши крупнейшие операторы аккуратно заняли 4 основных цвета хотя это и довольно очевидно.
За теорию спасибо, поздравляю с победой!

borsh 25 мар 2011 в 21:32

«4 основных цвета»

Yellow = Red + Green как бы.

nekt 26 мар 2011 в 00:35

так то в специальном цветовом пространстве — RGYB

Stalker_RED 28 мар 2011 в 20:40

может GRYB?

VitaZheltyakov 25 мар 2011 в 19:09

Статья хорошая, но повторяет ошибки предыдущих статей, которые публиковались на Хабре.
Зачем использовать нейросеть с сравнением с шаблонами изображений цифр? Можно для большинства из приведённых случаев (кроме последнего) использовать математический анализ. Он даст более высокий коэффициент угадывания и алгоритмы будут легче.
Суть математического анализа сводится к подсчёту количества точек разного цвета. То есть изображение делиться сеткой на 4-9 участков и подсчитывается количество белых точек + общее количество точек. Для каждой цифры соотношение количества точек в разных участках уникально, что позволяет легко довести коэффициент угадывания до хороших результатов.
Этот метод хорошо работает, если цифры имеют наклон не более 30 градусов и не пересекаются.

Особое спасибо за алгоритмы выделения отдельных цифр — это хорошая работа.

Pastafarianist 25 мар 2011 в 19:14

Если у вас термин «математический анализ» ассоциируется с подсчётом точек — я Вам искренне сочувствую.
Этот метод не будет работать в более-менее сложных случаях. Скажем, в первом — там размер символов слишком мал, чтобы производить подобные спекуляции.

tronix286 25 мар 2011 в 19:42

Да не, я бы тоже не заморачивался с нейросетями и сравнивал тупо по шаблону (с разным наклоном). Да, грубо и немного затратно по времени выполнения, зато результат был бы около 100% + пишется за пять минут.

YasonBy 26 мар 2011 в 00:37

А автор — «заморочился», и именно за это получил бумажку с римской цифрой.
Но Вы, конечно, смогли бы сделать его работу за пять минут, просто «не заморачивались».

nekt 26 мар 2011 в 00:39

Можно попросить вас на выходных потратить пять минут своего времени и показать вашу идею в виде кода? Мне интересно посмотреть, как можно добиться таких высоких темпов в разработке.

tronix286 26 мар 2011 в 04:53

Увы, в выходные я работаю. Вот сейчас уже выхожу из дома и буду только поздно вечером. Но намек я понял, попробую «заморочиться» в понедельник-вторник.

Pastafarianist 30 мар 2011 в 17:57

Среда подходит к концу, а «заморачивания» не видать…

Siddthartha 25 мар 2011 в 20:53

он прав. это подход вобщем математического, а в частности статистического анализа. так вполне можно сказать.
и в противовес итерационной магии нейросети, при таком подходе используются более быстрые, точные и простые вычисления.

Pastafarianist 25 мар 2011 в 22:37

Которые, однако, вряд ли дадут приемлемый результат в условиях большого алфавита (заметьте, «только цифры» — один раз из четырёх) и слишком маленького размера изображений.

Если интересует — попробуйте применить этот метод и сравните его эффективность с нейросетями. Зачем начинать холивары на пустом месте?

TheShock 26 мар 2011 в 21:14

Я с вами однозначно согласен в одном. Самое правильное завершение спора — ещё две статьи.
1. С описанием математики
2. Сравнение

Palehin 25 мар 2011 в 19:36

Отличная статья! Одназначно в избранное! Выходные предстоят занимательные)

ruASG 25 мар 2011 в 19:38

Ура! Ну хоть кто-то присоединился ко мне в использовании лицензий Creative Commons на Хабре!

На счёт запрета коммерческого использования. Действительно ли вам нужен этот запрет? Ведь никто не сможет, например, перевести вашу статью на английский язык для какого-нибудь сайта с рекламой (но из-за SA ваше произведение и на английском языке осталось бы свободным). Вашу статью даже нельзя скопировать в ЖЖ, потому что там тоже висит реклама. В общем, посмотрите почему запрет коммерческого использования — это плохо и запрещайте только если вам это очень нужно.

Pastafarianist 25 мар 2011 в 19:47

Понимаете, это тонкий намёк на то, что я не одобряю спам.

ruASG 25 мар 2011 в 19:55

Совершенно не понял что вы имели ввиду. Это вы свободные лицензии спамом назвали или ссылки, которые я привёл?

Pastafarianist 25 мар 2011 в 20:06

Спамом я называю одно из потенциально возможных применений моей программы.

tarepanda 26 мар 2011 в 02:57

Спамеры, соблюдающие лицензии? Оригинально.

veprbl 25 мар 2011 в 20:51

Вы указали только лицензию на сам текст, в то время как читатель имеет право использовать полученную в результате чтения вашей статьи информацию в любых целях. Сам код вы раздаёте под GPL, так что спаммеры могут его спокойно использовать (соблюдая условия, конечно).

Статья мне очень понравилась. Поздравляю с победой!

Pastafarianist 25 мар 2011 в 22:40

Нормально ли писать, что лицензия распространяется на «текст, а также всю информацию, в нём содержащуюся»? А также изменять условия лицензирования после публикации статьи? :)

veprbl 25 мар 2011 в 23:24

А как вы определите, что такая-то информация у меня в голове сформировалась именно только после прочтения вашей статьи?)
Изменять условия можно, вы же автор, но все те кто успел скопировать текст до этого, получается получили его на старых условиях.

middle 26 мар 2011 в 06:03

Информация не защищается законодательством об авторском праве. Законодательством защищаются лишь произведения.

Увы, автор с этим ничего поделать не может. Пусть думает что хочет, но юридически он не прав.

НЛО прилетело и опубликовало эту надпись здесь

Pastafarianist 26 мар 2011 в 15:25

Благодарю за разъяснения. Сменил лицензию на CC BY-SA.

Dragonizer 26 мар 2011 в 14:43

На хабре тоже есть реклама. Pastafarianist нарушает лицензию собственного текста? :)

Pastafarianist 26 мар 2011 в 14:53

Да? Странно. Сайтом пользуюсь уже полгода, ни разу никакой рекламы не видел.
Меня посещают смутные подозрения. AdBlock?

ruASG 26 мар 2011 в 15:39

Автор может делать со своим произведением всё что угодно и в том числе размещать на сайте с рекламой. Лицензия на автора не распространяется. Лицензия — это для других.

Dragonizer 26 мар 2011 в 17:23

Логично. Пардон.

TheShock 26 мар 2011 в 21:20

Ура! Ну хоть кто-то присоединился ко мне в использовании лицензий Creative Commons на Хабре!

У меня к вам прямой вопрос. Я туго разбираюсь в лицензиях, но давно хотел найти какую-нибудь свободную лицензию для текстов. Что-то типа LGPL или MIT. То есть близкая к полной свободе, но не «передача в публичное достояние». Типа, «за мной сохраняются авторские права, но можете делать со статьёй все, что угодно».

Что посоветуете?

Pastafarianist 26 мар 2011 в 22:06

Creative Commons Attribution-ShareAlike (CC BY-SA) — её, в частности, использует Википедия (можно увидеть в подвале любой статьи).

TheShock 27 мар 2011 в 19:23

Спасибо)

ruASG 27 мар 2011 в 19:18

Судя по таблице у MIT совсем нет копилефта, тогда вам подходит её аналог в мире контента — безкопилефтная Creative Commons Attribution (CC-BY). Она как бы говорит нам: «делайте всё что угодно, только указывайте моё авторство». Кстати, для России что общественное достояние, что CC-BY — фактически одинаковы, по закону всегда надо указывать автора (а вот в США для произведения в ОД можно не указывать).

LGPL имеет слабый копилефт. Больше свободных лицензий имеющих слабый копилефт я и таблица не знаем. Но нормальный копилефт имеет Creative Commons Attribution ShareAlike (CC-BY-SA).

TheShock 27 мар 2011 в 19:23

А что у этой статьи была за лицензия раньше? Которая запрещает комерческое использование?
Спасибо за ликбез)

ruASG 27 мар 2011 в 22:10

CC-BY-NC-SA.

AgentSmith 25 мар 2011 в 20:00

А я капчу красного оператора предварительно трансформировал по постоянному шаблону.
3D-капч я также преобразовывал к прямоугольному виду. Так распознавать было проще и процент ошибок заметно сокращался.

Pastafarianist 25 мар 2011 в 20:09

Это вы пересказываете собственный опыт или предлагаете правки к тексту статьи?

AndryX 25 мар 2011 в 21:12

Зачем все эти ссылки на lurkmore?

Pastafarianist 25 мар 2011 в 22:32

Так и знал, что кому-то не понравится :(

AndryX 25 мар 2011 в 22:41

Но вы так и не ответили, зачем? Чему в них нравиться вообще? =\

Вы лишь заставляете читателя прерываться на определение адреса ссылки и отвлекаете его от главного.

Pastafarianist 25 мар 2011 в 23:09

Ну давайте разбираться, где же я отвлекаю этого бедного читателя.

Всего в тексте 5 ссылок на лурк. Из них три во вступлении, одна в заключении и одна — в самом начале текста про первую капчу. Таким образом, получается, что от технической части (в которой находятся все Глубокие Идеи (тм)) я читателя не отвлекаю вообще, и в то же время менее значимые части разбавляются этими самыми ссылками. Видите ли, я старался писать так, чтобы это читать было интересно.

Я ответил на Ваш вопрос?

AndryX 25 мар 2011 в 23:20

Неа. И что интересного добавили эти ссылки? Их все желающие уже видели, лурк для хабра — не новость.

Лично мне после первых трёх вообще уже ни на какие ссылки смотреть не захотелось, но была бы там ценная информация — прочёл бы всё.

Pastafarianist 25 мар 2011 в 23:45

Если для Вас лурк — не новость, Вы должны быть прекрасно знакомы с тамошним стилем статей, где за невинными на первый взгляд заголовками ссылок часто скрывается неожиданное содержание. Причём чтение статей подразумевает, что вы наводите мышку на все ссылки подряд, но переходите лишь по единицам из них. Здесь я подразумевал то же самое — после первой же ссылки на лурк читатель должен был понять, что его ждёт в дальнейшем, и просто не переходить по ссылкам на вышеупомянутый сайт.

Режим Капитана отключён.

AndryX 26 мар 2011 в 09:32

Вы и комментатор ниже меня немного не так поняли. Я действовал соответственно вашему плану:
1. навёл мышку на первую ссылку, увидел лурк;
2. навёл мышку на вторую ссылку, увидел лурк;
3. навёл мышку на третью ссылку, увидел лурк;
4. попытался понять зачем они там, не получилось;
5. решил до конца статьи на ссылки не отвлекаться вообще тк. опыт мне уже говорил, что там ничего нового не увижу.

Но всё же, зачем ссылки если вы планировали, что на них переходить не нужно? Это ещё менее логично. Честно, когда моя логика говорит «нет», то я таких вещей просто не понимаю. Хотя против статьи в целом ничего не имею, она — торт.

Pastafarianist 26 мар 2011 в 11:23

Странно. Я только что пересмотрел начало статьи и получил результаты, несколько отличающиеся от Ваших.

Ссылки по очереди:

Балтийском научно-инженерном конкурсе,
CC BY-NC-SA
успешно решена. — Lurkmore
распознавание. — Lurkmore
Python
OpenCV
FANN,
профессионального инструмента отладки. — Lurkmore
эмпирически. — Lurkmore
правильно сказал, да?
Википедия
MinAreaRect2
Inpaint
реализацию
в специальной ветке фоума на своём сайте,
исходный код
файлы нейросетей
изображения.
Балтийском конкурсе
Intel ISEF
кому они нужны, — Lurkmore
функциональные
оси?
I2P
Netsukuku

Таким образом, Ваше высказывание выглядит, по меньшей мере, необоснованным.

AndryX 26 мар 2011 в 11:26

Что за конкурс мне было не интересно, а про лицензию CC и ряд других вещей я уже читал. Отмаз сработал? :)

DnV 26 мар 2011 в 12:53

Вы же не могли не заметить, что текст ссылок не совпадает с названиями статей Lurkmore? Это просто тот же приём, как если писать в скобках «читай так-то», или перечёркивать более эмоциональный, но менее стилистически подходящий вариант. Помогает более точно выразиться. А наводить на ссылки — не такая уж сложная работа. Или вы с девайса с сенсорным экраном (тут ссылка на айпад) статью читали? ;)

danSamara 26 мар 2011 в 00:16

Подсказка: при наведении мышки видно куда ссылка указывает, если лурк не нравиться — не переходите, из-за чего сыр бор?

nekt 26 мар 2011 в 00:42

Опа. Я эти ссылки банально не заметил при чтении. Разве что заинтересовался политикой лицензирования.

По теме ссылок — это плоский не смешной юмор. Конечно лучше, чем если все в сухом стиле преподносить. Но можно было бы и поинтереснее пошутить.

Pastafarianist 26 мар 2011 в 12:45

Предложения, примеры?

pandas 25 мар 2011 в 21:16

Спасибо, добавил в избранное!

Alexznadr 25 мар 2011 в 21:20

Любопытно, что многие капчаборцы используют нейронные сети для борьбы с поворотом изображений символов по сравнению с «эталоном».
Если сравнивать не обзбражение и эталон, а результаты применения к ним каких-либо преобразований нечувствительных к повроту — то результаты будут лучше а нейронные сети могут и не понадобится.

Беглое гугление по поводу преобразований нечувствительных к повороту выдаёт нам например слова «лог-полярное преобразование» + «вейвлет преобразование»

YasonBy 26 мар 2011 в 00:28

Любопытно, что в комментариях к любой толковой статье найдётся пачка теоретиков, знающих (понаслышке) 100500 методов, которые решили бы задачу в два счёта и со стопроцентной точностью.
Каким-либо обоснованием своих утверждений теоретики не утруждаются, ведь «беглое гугление» Гения куда значительнее, чем экспериментальные результаты черни…

Если Вы считаете, что «результаты будут лучше» — докажите, в противном случае это пустая болтовня.

nekt 26 мар 2011 в 00:43

за 5 минут получить 100% результат для любой капчи — не проблема.
Проблема только в том, что считать 5ю минутами, 100% результатом и любой капчей.

Kalobok 25 мар 2011 в 21:43

За статью спасибо, весьма познавательно. А насчет распознавания слипшихся символов (особенно в последнем случае) — первое, что мне пришло в голову, попробовать распознавать сразу пары или даже тройки. Конечно, возможных вариантов получится намного больше, но есть подозрение, что и качество заметно подрастет.

Pastafarianist 25 мар 2011 в 22:51

Возникает естественная проблема — а где брать образцы для обучения? Там алфавит на 22 символа, если хотим распознавать пары, понадобится, по крайней мере, 484 сегмента по 2 символа в каждом — в идеальном случае это 194 картинки, но идеальных случае в природе не бывает. Покажите мне человека, который добровольно согласится распознавать такое количество капч (китайских студентов и декапчер.ком не предлагать!). Я руками переименовывал все эти изображения, и, честно говоря, удовольствия мало. Это первое.

Второе — что-то я сомневаюсь, что при таком количестве различных образцов сеть сможет сделать вменяемое обобщение. Однако, проверке это утверждение не поддаётся из-за п.1.

Kalobok 26 мар 2011 в 02:22

Ну, для обучения можно нагенерить пары самостоятельно из одиночных символов — ведь примерный их вид известен. Думаю, должно прокатить. А вот со сложностью сети могут быть проблемы, это да. Но я бы попробовал.

prox 25 мар 2011 в 21:52

подкинули бы пару идей о эффективной борьбе с авто-распознаванием

Doman 25 мар 2011 в 22:09

Для каждой из каптч, автор описал плюсы и минусы. Если сложить плюсы и убрать минусы, то получится почти идеальная капча )

Pastafarianist 25 мар 2011 в 22:30

Ага, Ucoz к ней неплохо приблизился.

TiFFolk 26 мар 2011 в 21:27

Там человек то хер поймет, что написано.

Pastafarianist 26 мар 2011 в 22:08

Да, я это и имел в виду.

xiWera 25 мар 2011 в 22:55

Сделайте N наборов «порчи картинки» и накладывайте их случайным образом.
Из вышеперечисленного выделяется:
* разные цвета для букв
* разные аффинные преобразования для букв
* аффинные преобразования для всей строки
* 3d выпуклость
* пустые квадраты между буквами, буквами не являющиеся
* мусор
* переменное количество букв
* переменное направление чтения
* тестовый вопрос (введите каждую пятую букву на экране)

Идеальная капча должна выдавать строку подвергнувшуюся случайному набору преобразований. Так в один момент времени такая капча выдаст цветные буквы в 3d, в другой раз мусор и скривленную строку с вопросом и тп.

Pastafarianist 25 мар 2011 в 22:59

Если не ошибаюсь, что-то подобное реализовано у Webmoney.

AndryX 25 мар 2011 в 23:00

У них много различных вариантов генерации, но практически все распознаются проще простого.

insa 26 мар 2011 в 10:57

> Идеальная капча должна выдавать строку подвергнувшуюся случайному набору преобразований.

И в результате будет у вас 10% капч которые распознаются с полпинка, потому что такие преобразования выпали. И этого будет более чем достаточно.

xiWera 26 мар 2011 в 11:57

ага, если знать как распознавать конкретную капчу, есть много способов обдурить написаный кем-нибудь «детектор наложенных преобразований»

dimanjy 26 мар 2011 в 00:06

Показывайте не цифры/буквы, а фрукты-овощи, ну или фотографии знаменитостей :)

JayDi 26 мар 2011 в 04:22

Кошки

НЛО прилетело и опубликовало эту надпись здесь

Pastafarianist 26 мар 2011 в 09:34

AndryX 26 мар 2011 в 10:52

Два чудища в масках скинхедов разрывают девушку с поднятыми руками пополам. Каков мой диагноз? :)

Pastafarianist 26 мар 2011 в 11:02

Segmentation fault.

DnV 26 мар 2011 в 14:06

Годен. Вот если бы в вашем описании фигурировали хотя бы демоны и девственница, а также употреблялись слова «срущие» и «насилуют»… )

AndryX 26 мар 2011 в 20:43

Ну монстры — это и есть демоны :D, а девственница ли девушка не известно, как и дальнейшие их действия.

Но я действительно сказал о том, что увидел на пятне :). И это меня беспокоит, хочу об этом поговорить :).

TheShock 26 мар 2011 в 21:24

Черт, увидел то же самое. Там ещё сиськи торчат. А точка посередине — это бляха от пояса.

AndryX 26 мар 2011 в 22:02

Ещё у неё одна нога или она бежит

НЛО прилетело и опубликовало эту надпись здесь

Jabberwok 26 мар 2011 в 10:57

Распознать текст тут не сложно, потому что он не искажен. А потом заправляем сюда.

НЛО прилетело и опубликовало эту надпись здесь

Pastafarianist 26 мар 2011 в 11:06

prox 27 мар 2011 в 05:15

По-моему капча должна быть невыполнима для бота и не навязчива для человека (может так), не все же Онотолии в третьем поколении.

Pastafarianist 27 мар 2011 в 11:10

Капча для xUSSR:

xiWera 25 мар 2011 в 22:45

Для детекта ограниченного набора образов с неизвестными аффиными преобразоваиями лучше всего использовать сверточные нейронные сети (они фактически разбивают картинку на набор признаков и по ним детект уже гораздо эффективней)

Pastafarianist 25 мар 2011 в 22:57

Сначала прочитал эпитет насчёт нейросетей как «сверхточные», много думал…

Да, я хотел их использовать. Но, к сожалению, FANN их не поддерживает, адекватных альтернатив (в первую очередь, по скорости) я не нашёл, а писать что-то своё — слишком сложно и долго.

P.S.: если кто-то заинтересуется темой, то в интернете проще найти информацию по запросу «convolutional neural networks».

kitaisc 25 мар 2011 в 23:02

Раньше, что бы защитится от ботов использовал капчу, но она не спасает. Спасло знание олбанского и проверка по словарю. Только живой человек сможет понять фразу «Сем памножыть натры».

Pastafarianist 25 мар 2011 в 23:15

Пробовали reCAPTCHA? Насколько я знаю, одна из самых сложных на текущий момент.

Насчёт олбанского — уверен, хороший парсер и словарь сломят и такую защиту :)

kitaisc 25 мар 2011 в 23:24

При использовании reCAPTCHA боты пробивались только так, а при таком варианте защиты ботов почти нет, т.е. есть подозрение, что рекламных ботов все таки регистрируют в ручную, но их так мало, что можно сказать, что их нет.

kitaisc 25 мар 2011 в 23:24

не туда )

Pastafarianist 25 мар 2011 в 23:30

Возможно, дело в том, что защита типа капчи слишком хорошо изучена, и для того, чтобы её пробить, используют ~~негров~~ бедных китайских студентов? В интернете же полно сайтов, предлагающих «вводить символы с картинок 1$/1000 шт.». То есть проблема не в устойчивости капч к распознаванию, а в людях, соглашающихся выполнять настолько бесполезную работу.

kitaisc 26 мар 2011 в 01:29

Проблема в том, что капчу с цифрами поймет даже бездушная машина, а высокослоговые предложения Русского языка поймет только НАШ человек )

Aracon 26 мар 2011 в 19:15

Слышал, что в последнем Хрумере reCAPTCHA автоматически распознаётся.

НЛО прилетело и опубликовало эту надпись здесь

Pastafarianist 25 мар 2011 в 23:25

Вот что обидно — в конце статьи содержится Вопрос Жизни, Вселенной и проч., а ни один из комментариев даже не затронул эту тему. Неужели никто ничего не подскажет? :(

noonesshadow 26 мар 2011 в 00:20

Могу предложить две мысли (оценки трудоемкости не с меня :))

Первая, с минимальным научным компонентом. Интеграция большинства сторонних обновлений в Windows Update. Уверен, это было бы полезно сотням миллионов. Не знаю, как монетизировать, правда, но должен быть способ :) И подходит ли это под нужные конкурсы.

Вторая. Экономический анализ мира.
Компании, Люди, Государства. Тратят и получают деньги. Производят и потребляют товары и услуги. Добывают сырье. Находятся в постоянных отношениях друг с другом. В Сети, и не только, есть множество информации, иногда прямой, иногда косвенной — объемы продаж, цены, оценки стоимости компаний, сделки, прогнозы, уровни добычи. Задача — построить модель, которая находилась бы в состоянии постоянного уточнения с новыми данными. И позволяла увидеть экономику мира, с возможностью zoom in/ zoom out. Дальше — прогнозирование :)

Pastafarianist 26 мар 2011 в 08:53

Реализация первой значительно осложняется тем печальным фактом, что у меня, к сожалению, нет доступа к внутренностям Windows Update. Даже если бы я сделал аналогичный сервис, кто даст гарантию, что меня послушает M$?

Вторую вы описали весьма расплывчато (по крайней мере, для меня), хотя, конечно, звучит захватывающе. Но вот первая же мысль в связи с реализацией — нужно собирать статистику по интернету -> нужно аккуратно парсить содержимое статей по этой теме -> нужно понимать это содержимое -> нужно пройти тест Тьюринга :(

noonesshadow 26 мар 2011 в 13:12

В зависимости от страны, в которой вы находитесь, могут быть юридически чистые способы получения доступа к внутренностям на клиенте. Сервер, конечно, понадобится свой :)

Вторая — реализация точно не будет простой :)

HomoErectus 25 мар 2011 в 23:50

а какой хоть ноутбук?
интересно ведь.

Pastafarianist 26 мар 2011 в 08:56

Dell Inspiron Mini 1018. Это, конечно, нетбук, и стоит он соответственно, что не мешает мне в полной мере наслаждаться победой :)

aml 26 мар 2011 в 05:47

Спасибо за статью, отлично написано. Вот вопрос возник по последней капче, там где цифры загораживали соседей. Нельзя ли на вход нейронной сети подавать +1, где чёрный пиксель, -1, где белый, и 0, где серый (иными словами, где он загорожен соседней цифрой)? Может ли нейронная сеть воспринимать среднее нейтральное значение как «неизвестность» и принимать решение на основе только тех пикселей, которые ей известны?

Pastafarianist 26 мар 2011 в 08:47

Вы не поверите…

mrded 26 мар 2011 в 06:43

Хабр и капча

Pastafarianist 26 мар 2011 в 09:02

Да, я это раньше читал. Попутно подумал, что новую «святую» капчу я смогу распознать где-то на уровне 30-40%, ибо свято верю в мощь нейросетей, а препроцесс и сегментация там весьма тривиальны. Впрочем, печально, конечно, что администрация позволяет себе такое.

Karbas 26 мар 2011 в 09:01

Спасибо, статья интересная и легко читается.
Автор, а вы не хотите поучаствовать в Инетрнет-Математике 2011? Там вроде как раз про работу с изображениями в этом году.

Pastafarianist 26 мар 2011 в 09:04

Первый раз слышу об этом конкурсе.

Думаю, нет. До дедлайна два месяца, а дел по горло, тем более что придётся разбираться в новой для себя теме. Не успею.

Oenomaus 26 мар 2011 в 11:01

Идеальная капча блаблабла, пока есть индусы, любая капча обходится в такие копейки, что спам будет процветать. Я вообще удивлен, что многие монстры индустрии до сих пор пытаются капчами что-то закрывать. Эта защита устарела лет на десять.

Nordvind 26 мар 2011 в 11:22

Если нет под рукой Wolfram Mathematica, с матан-капчами они повозятся =)

Oenomaus 26 мар 2011 в 11:59

Бррр, куда они повозятся? Если человек не в состоянии распознать капчу без дополнительных средств, то зачем такая капча?

А я понял, вы не так поняли мое упоминание об индусах :)

Pastafarianist 26 мар 2011 в 11:35

С вами несогласны Google, Yahoo, Wikipedia, Windows Live и ещё тысячи сайтов поменьше.

Oenomaus 26 мар 2011 в 12:09

Ага, я именно про этих монстров индустрии и говорю, хотя в свое время мы легко сотнями регистрировали аккаунты на gmail обходя капчу именно дешевыми человеческими ресурсами, а не сложными и громоздкими система на основе нейронных сетей и прочего.

Задача капчи по сути — сделать автоматическую регистрацию аккаунтов в системе дорогой. То есть чтобы потенциальный «спамер» не делал сотни аккаунтов легких нажатием кнопки или делал бы, но для этого ему бы пришлось создать ПО, которое было бы настолько дорогостоящим, что затраты на него не окупались бы прибылью полученной с этих аккаунтов. При этом основная проблема капчи — она еще и человеком должна нормально распознаваться, не напрягая его.

Так вот основная проблема в том, что эта система легко обходится человеком и до тех пор, пока есть индусы, капча защищает лишь от школоты, которая решила нарегать себе кучу аккаунтов примитивными программками. Профессионалы давно решили эту проблему человеческим фактором и использование капчи в качестве защиты давно устарело.

Это не пришлось бы объяснять людям, которым хоть раз понадобилось бы зарегистрировать в какой-либо системе с капчами больше сотни аккаунтов. Основная проблема современных систем защиты в том числе и у монстров индустрии состоит в том, что у них на работу приняты крутые спецы по защите, которые никогда не работали по другую сторону. Они борются с проблемой, которая им кажется, а не с той, которая есть на самом деле.

Oenomaus 26 мар 2011 в 12:10

Да, а на тему альтернативного мнения, миллионов, которые не могут ошибаться и блаблабла, именно благодаря этому деньги в мире делятся 80/20, а не наоборот :) Пока ставятся защиты типа капчи, спамеры будут грести миллионы лопатами :)

insa 26 мар 2011 в 11:44

Господа, «взламывающие» капчи. Вам сей мессадж.

Капча — это штука позволяющая отсеивать низкопрофессиональных спаммеров. Это первая линия обороны от спама на ваш сотовый телефон, ваш форум, в вашу гостевую. К сожалению она не совершенна, и совершенной быть не может. Но ничего лучше пока не придумали.

Поэтому помните, что выкладывая в паблик вот такие статьи с исходниками вы делаете ровно одну вещь — уменьшаете входной порог для всевозможных спамеров. Думаю это единственные люди, которые скажут вам спасибо.

Pastafarianist 26 мар 2011 в 12:04

А вторая линия обороны точно существует?

insa 26 мар 2011 в 13:11

У оператора green вторая линия точно есть. Насчет остальных не знаю.

andreypaa 26 мар 2011 в 12:04

С таким подходом вообще треть интернета можно снимать с публикации ;)

Oenomaus 26 мар 2011 в 12:15

Капча — это морально устаревшая защита, мешающая нормальным людям. Меня вот вымораживают капчи с разными оттенками, как человека, не различающего некоторые оттенки зеленого, для меня это катастрофа. Я встречал сайты, где не регался по причине того, что с трех раз не смог правильно ввести капчу и т.д. Есть намного более интересные и серьезные варианты защиты, которые не избавят от спама целиком и полностью, но сделают его настолько дорогим, что встанет вопрос а надо ли оно. Но чтобы их придумать и понять надо сначала попробовать поработать с другой стороны.

А эта статья интересна не с точки зрения капч, а с точки зрения распознавания символов, мне вот таких статей не хватало в институте на занятиях по нейронным сетям. А с точки зрения информационной безопасности — статья не несет серьезной смысловой нагрузки.

Pastafarianist 26 мар 2011 в 12:51

Есть намного более интересные и серьезные варианты защиты, которые не избавят от спама целиком и полностью, но сделают его настолько дорогим, что встанет вопрос а надо ли оно.

Не будьте голословными. Объясните хотя бы в общих чертах, что вы имеете в виду.

А с точки зрения информационной безопасности — статья не несет серьезной смысловой нагрузки.

Предлагаете перенести в другой блог?

НЛО прилетело и опубликовало эту надпись здесь

Pastafarianist 26 мар 2011 в 14:31

Уговорили. Перенесу по истечении 24 часов с момента публикации.

Oenomaus 26 мар 2011 в 13:46

Насчет неголословности обязательно объясню, но чуть попозже, когда у себя на сайте оттестируем защиту и убедимся в достаточной эффективности, чтобы действительно не быть голословными. С другой стороны в паблике это точно не будет выкладываться, потому что до появлени в паблике это будет как раз эффективной защитой :)

вот ниже правильно предложили в обработку изображений. я бы там такую статью скорее стал искать.

insa 26 мар 2011 в 13:20

> Есть намного более интересные и серьезные варианты защиты, которые не избавят от спама целиком и полностью, но сделают его настолько дорогим, что встанет вопрос а надо ли оно.

Поделитесь информацией. Спасёте интернет от капчи.

Oenomaus 26 мар 2011 в 13:46

Ага или помогу спамерам в очередной раз модернизировать свой софт :) Не для паблика и после тестов.

Ice_venom 26 мар 2011 в 18:35

Ну рас пошла такая тема, выложил свой ммс флудер зеленого оператора с автораспознаванием капчи.

Pastafarianist 26 мар 2011 в 18:48

Там сейчас другая капча, почти нечитабельная.

Ice_venom 26 мар 2011 в 18:50

Ну вот, слишком поздно кинул в паблик:(
Но в любом случае можно декомпильнуть и посмотреть что-как.

Pastafarianist 26 мар 2011 в 18:59

Да ладно, судя по скрину, в старой капче ничего сложного не было :)
Кстати, по-моему, новая тоже сложная только для человека, компьютер с ней легко разберётся.

EiZeRR 26 мар 2011 в 21:26

хорошая работа.

я не буду писать про то, что распознавать капчу автоматическими методами нерентабельно уже года 3:)

Pastafarianist 26 мар 2011 в 22:21

В таком случае воспринимайте статью просто как описание подхода к распознаванию символов.

afiskon 31 мар 2011 в 11:14

Скажите, я правильно понял, что в каждом случае во втором слое вы использовали ровно три нейрона?

Pastafarianist 31 мар 2011 в 19:30

Нет. Просто иллюстрация неудачная :)

Я экспериментировал с различным количеством нейронов во втором слое, и остановился на одной трети от числа нейронов первого слоя.

afiskon 1 апр 2011 в 04:07

При условии, что на вход подавалась ч/б картинка 30 x 30? Ее никак перед этим не изменяли (усреднение цвета по соседним пикселям и тп)?

Pastafarianist 1 апр 2011 в 19:22

Вообще-то, статья как раз и посвящена тому, что делается с этой картинкой до передачи её в нейросеть. В статье были примеры изображений перед самой передачей:

Pastafarianist 31 мар 2011 в 19:33

Уважаемый минусатор. Скажите, вы испытываете какое-то особое удовольствие от того, что у всех моих последних комментариев ровно по одному минусу?

AgentSmith 12 ноя 2012 в 21:02

А не проще ли воспользоваться пиксодромовским сервисом антикапчи Pixodrom? ( pixodrom.com )

Pastafarianist 12 ноя 2012 в 21:32

Задача была именно написать программу распознавания, а не спамить.

Delphist2008 29 мар 2013 в 10:21

Буду очень благодарен, если кто-нибудь объяснит, как это запустить.Перепробовал штуки 3 разных версий питона, ещё 3 разных opencv, но запустить не смог.Желателен ответ в духе «поставить такую-то версию питона, такую-то openc, скопировать то-то туда-то, затем там-то нажать такую-то кнопку».

Pastafarianist 29 мар 2013 в 18:48

Всё писалось под Python 2.6.6, OpenCV 2.1, FANN 2.1.0beta. Но установка OpenCV и FANN — это весьма трудоёмкий процесс, и 2 года спустя я уже не смогу описать вам все детали. Впрочем, что касается FANN: где-то в интернете я видел хорошую инструкцию по его установке под Linux, попробуйте погуглить.

Dmitriy002 17 фев 2023 в 13:16

Не одобряю вашу работу - вы сделали плохое дело. Ваша работа не принесла никакой пользы, а только создала проблемы.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий