Comments 64
Не уловил проблем для ботов распознать такую капчу. Почему им это должно быть трудно?
Все мои попытки распознать существующими OCR были неудачными
просто сначала надо к картинке применить несколько фильтров.
Да вы попробуйте, примените
А вы вообще пробовали сами? Например, Erosion, Dilation?
Пробовала, но конечно не все, и не во всех сочетаниях.
Приведите пример вашего результата обработки. Не «Привет» (он и так, как выяснилось, распознается), а «Параллелограмм»
Приведите пример вашего результата обработки. Не «Привет» (он и так, как выяснилось, распознается), а «Параллелограмм»
загружал анимированную GIF-ку:


Все понятно. Вопрос снят, тему закрываю. Спасибо за pixodrom.
Кстати, в данном случае именно бот успешно пройдёт капчу, в отличие от человека, который впишет «Параллелограмм».
Всплыли новые факты, тему открываю вновь
habrahabr.ru/post/182106/
habrahabr.ru/post/182106/
Ого, вот это расследование :)
Интересно…
Интересно…
Оказалось, что это было пустое расследование. Все и так знали, что там люди отгадывают.
Да и цитата с главной
Вот только адрес для связи я у них так и не нашла. Может просто плохо искала.
Да и цитата с главной
According to using human powerкак-бы намекает.
Вот только адрес для связи я у них так и не нашла. Может просто плохо искала.
Каким OCR-системами вы пользовались, если не секрет?
Даже бесплатный тест на pixodrom.com проходит на ура
Даже бесплатный тест на pixodrom.com проходит на ура
Да, действительно, разреженный «Привет» распознался.
Слитный «Параллелограмм» не распознается
Слитный «Параллелограмм» не распознается
Я тоже попробовал «Параллелограмм» распознать. Написало ошибку, что картинка по объёму большая.
Так что здесь дело не в слитности, а в техническом намеренном ограничении системы. Которое, кстати, при желании снимается.
Так что здесь дело не в слитности, а в техническом намеренном ограничении системы. Которое, кстати, при желании снимается.
Разве нельзя взять первый кадр gif-изображения и просто распознать текст обычными способами?
Ну или поменять формат на другой, насколько я понимаю, анимация исчезнет и можно перейти к «обычным» методам.
Скептически отношусь к данному способу.
UPD: И если такая капча занимается много ресурсов, будет возможна DDOS-атака, разве нет?
Ну или поменять формат на другой, насколько я понимаю, анимация исчезнет и можно перейти к «обычным» методам.
Скептически отношусь к данному способу.
UPD: И если такая капча занимается много ресурсов, будет возможна DDOS-атака, разве нет?
А вы попробуйте
Дело в том, что на фоне не всегда одиночные точки, а бывают и по 3 и по 4, 5. И наоборот, узкие линии символов часто разъедаются.
Вы вообще знакомы с обработкой изображений? Ну хоть совсем чуть-чуть?
То, что вы описываете — это самая распространённая задача по обработке изображений.
И решений этого вопроса — тьма. Даже искать особо не надо.
Весь коммерческий OCR-софт живёт за счёт этих элементарных алгоритмов, не говоря уже про распознавание автомобильных номеров и прочие прикладные вещи.
То, что вы описываете — это самая распространённая задача по обработке изображений.
И решений этого вопроса — тьма. Даже искать особо не надо.
Весь коммерческий OCR-софт живёт за счёт этих элементарных алгоритмов, не говоря уже про распознавание автомобильных номеров и прочие прикладные вещи.
Очень на это надеюсь
Чего только не узнаешь из комментов! Спасибо за ссылку :)
"Сама по себе идея — ничего не стоит. Стоимость имеет ее практическое осуществление" ©
С точки зрения распознавания ваша капча достаточно легко распознается.
Для этого надо все кадры объединить вместе, отбросить редкие точки, после чего сделать заливку плотной группы точек.
В итоге получим достаточно хороший текст, который мне кажется будет хорошо распознаваться.
Современные капчи используют другой прием — только человек способен выделить текст из кучи линий и другого мусора, даже если они сделаны тем же цветом и яркостью.
Т.е. капча использует интеллектуальное преобразование, а не механическое.
Но идея с движением достаточно интересна.
С точки зрения распознавания ваша капча достаточно легко распознается.
Для этого надо все кадры объединить вместе, отбросить редкие точки, после чего сделать заливку плотной группы точек.
В итоге получим достаточно хороший текст, который мне кажется будет хорошо распознаваться.
Современные капчи используют другой прием — только человек способен выделить текст из кучи линий и другого мусора, даже если они сделаны тем же цветом и яркостью.
Т.е. капча использует интеллектуальное преобразование, а не механическое.
Но идея с движением достаточно интересна.
Надо распределить текст капчи по частям на несколько кадров gif-а.
идея с движением не нова, где то на хабре уже приводили большое количество каптч.
Просмотрела все. Из похожих только www.nucaptcha.com/
В далёком 2005-м году движущаяся капча была у e-Gold
Потом ещё у кого-то. Но она не приживалась и со временем все ставили либо статичную, либо вообще от неё отказывались
Потом ещё у кого-то. Но она не приживалась и со временем все ставили либо статичную, либо вообще от неё отказывались
Ну статью со списком каптч я так и не нашел, но как раз про нукапчу на хабре писали habrahabr.ru/post/98162/
Вот довольно-таки красиво выглядящая каптча:
www.hellocaptcha.com/
Хотя, там просто надо повернуть буквы, разить и скормить OCR.
www.hellocaptcha.com/
Хотя, там просто надо повернуть буквы, разить и скормить OCR.
>>Вопросы и проблемы
На практике обычно в большинстве случаев так:
В начале берут что-то стандартное, рекапчу, выдернутый откуда-то кусок, все что под руку подвернется.
Если проект растет и если возникает проблема ботов — пишут что-то своё нестандартное, но несложное, чего нет в стандартных базах ботов.
Если проект очень-очень вырос и ботов пишут уже конкретно под него — тогда уже начинают задумываться над капчей и делать что-то совсем нестандартное.
К вопросу написания сервиса капчи — пишите, почему нет, только как обретете известность ботов будут писать уже конкретно под вашу капчу и она для большинства потеряет смысл. Сломают и заботят все что угодно — если будет экономическая целесообразность.
На практике обычно в большинстве случаев так:
В начале берут что-то стандартное, рекапчу, выдернутый откуда-то кусок, все что под руку подвернется.
Если проект растет и если возникает проблема ботов — пишут что-то своё нестандартное, но несложное, чего нет в стандартных базах ботов.
Если проект очень-очень вырос и ботов пишут уже конкретно под него — тогда уже начинают задумываться над капчей и делать что-то совсем нестандартное.
К вопросу написания сервиса капчи — пишите, почему нет, только как обретете известность ботов будут писать уже конкретно под вашу капчу и она для большинства потеряет смысл. Сломают и заботят все что угодно — если будет экономическая целесообразность.
Не буду писать сервис, потому что пока не вижу путей монетизации.
Брать хэш от полученной картинки и сохранять в базу, а потом продавать ботам ответ за 10 центов!
Хеш? Картинка всегда разная, а значит и хеш разный. Или я не поняла мысли?
Сервис генерирует картинку и должен отдать юзеру слово, которое на ней, что бы тот смог сделать проверку того что ввёл пользователь. Одной картинке можно считать что соответствует один хеш от файла (если забить на коллизии). Бот берёт хэш от картинки, приходит к сервису и говорит ему: «Вот тут на одном сервисе заюзана твоя капча, давай ты мне скажешь ответ, а я тебе дам 10 центов».
Но это больше была шутка, подобная той, что вирусы разрабатывают производители антивирусов.
Но это больше была шутка, подобная той, что вирусы разрабатывают производители антивирусов.
а если разбить картинку на несколько слоев с разными видимыми частями букв и заанимировать?

Человек-то сможет такое прочитать?

Человек-то сможет такое прочитать?
У человека есть сильная сторона — ассоциативное мышление, что одновременно является слабой стороной любого бота. Почему нет (не встречал) капч на этом принципе? Например, фотка известного человека (Пушкин, Наполеон и т.д.) с требованием ввести фамилию. Добавляя шум к фотке, можно гарантировать уникальность изображения.
Я долгое время думал, что Марлон Брандо — это она (вероятно, по аналогии с Мэрилин Монро и Брижит Бардо). Известных ВСЕМ людей кот наплакал: старшее поколение не знает рэпера, не смотрящие телевизор не знают звезду, и т.д.
Но ведь и не каждую капчу вы угадываете, не так ли?
тут есть два выхода:
1. Возможность пропускать капчу, если персонаж тебе неизвестен
2. Формировать базы картинок в зависимости от тематики сайтов. Например, на IT-сообществах типа Хабра показывать Джобса и Гейтса, на музыкальных — музыкантов, ну и общая база с включением известных политиков, мировых звёзд и культовых личностей.
Это куда лучше чем та же самая капча, которая находится тут, на хабре, ввожу её всегда не с первого раза.
Но есть еще другой способ защититься от спама и обойтись вообще без капчи, он описан здесь, не знаю, почему он до сих пор не так популярен.
1. Возможность пропускать капчу, если персонаж тебе неизвестен
2. Формировать базы картинок в зависимости от тематики сайтов. Например, на IT-сообществах типа Хабра показывать Джобса и Гейтса, на музыкальных — музыкантов, ну и общая база с включением известных политиков, мировых звёзд и культовых личностей.
Это куда лучше чем та же самая капча, которая находится тут, на хабре, ввожу её всегда не с первого раза.
Но есть еще другой способ защититься от спама и обойтись вообще без капчи, он описан здесь, не знаю, почему он до сих пор не так популярен.
Подобные задания может создавать (собирать фотографии и подписывать фамилии) только человек, а значит их будет очень ограниченное количество. Это позволит злоумышленнику сделать такую же базу фотографий и без каких-либо проблем выдавать по ней ответы.
1. Благодаря использованию настоящих слов, боту не придется очень точно распознавать символы — можно сделать пару-тройку ошибок и все равно вытащить правильный ответ из словаря.
2. Наличие нескольких кадров позволяет провести распознавание несколько раз (дла каждого кадра) и выбрать наиболее часто встречающийся.
3. Ресурсоемкость генерации и размер картинки делают из капчи идеальную цель для DDoS атаки.
4. Капча сама по себе не очень надежная — применив фильры, можно получить хорошую, незашумленную, картинку для нейросети.
2. Наличие нескольких кадров позволяет провести распознавание несколько раз (дла каждого кадра) и выбрать наиболее часто встречающийся.
3. Ресурсоемкость генерации и размер картинки делают из капчи идеальную цель для DDoS атаки.
4. Капча сама по себе не очень надежная — применив фильры, можно получить хорошую, незашумленную, картинку для нейросети.
Автор, картинки не отображаются. Перезалейте изображение на habrastorage.
Кстати, а что означает иероглиф 示设备噐件?
Sign up to leave a comment.
Ты кто такой? Бот? Давай, до свидания!