marks17 апр 2014 в 09:04

Новый алгоритм распознавания изображений от Google способен распознавать CAPTCHA с точностью 99,8%

1 мин

66K

Информационная безопасность * Обработка изображений *

+62

102

Комментарии 102

Evengard 17 апр 2014 в 09:13

После улучшения Рекаптчи её человек вообще дешифровать сможет?

valyard 17 апр 2014 в 09:57

Скрытый текст

hDrummer 17 апр 2014 в 11:02

Только человек Будущего! =)

Joshua5 17 апр 2014 в 11:22

Скрытый текст

MrShoor 17 апр 2014 в 13:02

Будет капча наоборот. Угадал — значит робот :D

SergeKuznetsov 18 апр 2014 в 09:56

Введите слово:

Begetan 18 апр 2014 в 10:08

Ж О П А

Угадал?

ZiGR 19 апр 2014 в 08:44

«Это было не сложно».

MisterX 17 апр 2014 в 09:13

Теперь капчу будет еще труднее ввести человеку, для которого она создавалась.

SerCe 17 апр 2014 в 09:36

В итоге будут другие критерии: распознал капчу — робот, ввел неправильно — человек!

gotozero 17 апр 2014 в 10:32

Только вчера выкладывали в топик про double, опять актуально. )
i.imgur.com/4GU7kg7.png

chabapok 18 апр 2014 в 11:50

Кстати вот, wolfamalpha даже понимает, что это 3/10. Так что способ не прокатывает.

Bas1l 17 апр 2014 в 09:18

Как же плохо, когда нет хотя бы обзорного описания алгоритма и ссылки на научную статью (ссылка на статью, кстати, есть на techcrunch, а статья открыта). На techcrunch же есть и краткое описаиние—распознавание идет с помощью deep convolutional neural network.

marks 17 апр 2014 в 10:00

Да, вы правы. Ссылки добавлены.

BelBES 17 апр 2014 в 12:43

Статья ксати так себе по содержанию) Судя по всему тут все дело не в алгоритме, а в немаленькой обучающей выборке и долгом прцессе обучения. Т.ч. повторить такой эксперимент кому-то кроме Google будет сложновато…

ploop 17 апр 2014 в 09:19

Такими темпами думается мне, капче жить осталось не долго. Скоро алгоритмы переплюнут человека в этом деле.

Evengard 17 апр 2014 в 09:21

Так собственно… Судя по данной статье — уже переплюнули.

ploop 17 апр 2014 в 09:25

А они как-то предоставляют доступ к алгоритму? Понятно, что их мощностями и возможностями он уже работает, но ведь злоумышленники не могут им воспользоваться. Пока…

valplo 17 апр 2014 в 10:28

Секьюрити троу обскьюрити — некошерно.

Darka 17 апр 2014 в 09:22

Рекапчу уже невозможно распознать с первого раза неанглоговорящему человеку.

Semisonic 17 апр 2014 в 16:56

А толку от того, англоговорящий ты или не англоговорящий. Там всё равно какая-то мешанина из обрывков слов.

Sudno 18 апр 2014 в 08:38

… и номеров домов.

Tabke 18 апр 2014 в 10:23

Номера домов вводить не нужно. Не знали?

Sudno 18 апр 2014 в 10:32

Где вы были раньше…

vvzvlad 20 апр 2014 в 02:24

Почему?

Tabke 20 апр 2014 в 06:43

В том смысле, что не обязательно. Достаточно ввести основное слово, а дополнительный ребус от гугла (раньше были отсканированные слова из книг, сейчас номера домов) можно просто проигнорировать. Каптча всё-равно сработает.

Shoonoise 20 апр 2014 в 08:04

Потому что они сами не знают что вы должны ввести (гугл купил компанию котарая придумала через капчу текст распознавать).

vvzvlad 20 апр 2014 в 23:12

Ну это понятно. Меня смутило слово «не нужно», вместо «не обязательно».

gleb_kudr 17 апр 2014 в 09:36

Уже год как, наверное. Стабильно ошибаюсь при вводе многих видов капчи, причем по три-четыре раза. Учитывая, что после каждой попытки еще зачастую нужно вводить заново логин + пароль, это бесит невероятно.

kirias 17 апр 2014 в 11:19

А еще дико бесит обратная ситуация — капчу ввел правильно, но паролем ошибся. И доказывай потом снова, что ты не холодильник…

redskif 17 апр 2014 в 12:34

Надо сначала обновлять капчу, пока не появится боле-менее приемлемый вариант, а потом уже заполнять остальные поля.

Rivethead 17 апр 2014 в 09:53

Просто алгоритм распознавания человека сменят. Если ввод капчи с первого раза — алгоритм усомниться в человечности вводящего :)

Athari 17 апр 2014 в 17:05

Такими темпами думается мне, капче жить осталось не долго.

Кому надо, уже давно пользуется сервисами для разгадывания капч. Посмотрите цены. Разницы в эффективности между 90% и 99.9% — только один лишний запрос на десяток запросов.

Соревнование бессмысленно, капчи уже сломаны и не работают, если кто-то нацелился конкретно на ваш сайт. Можно вспомнить хотя бы войну рапидшары с автоматическими качалками, когда каждый день использовался новый шрифт, и каждый же день обновлялись скрипты.

vaslobas 17 апр 2014 в 19:03

Так многие (если не все) сервисы разгадования капч сажают китайцев и они уже разгадывают. На антигейте точно китайцы разгадывают.

PS. Причина загрузки под 100% мощностей по воскресеньям — выходные у китайцев/индусов, просьба относиться с понимаем. Постараемся их как-то простимулировать. (с)антигейт

samodum 25 апр 2014 в 11:08

Цены конечно жесть по сравнению с тем же пиксодромом, например: pixodrom.com
оттуда: «у нас самая низкая цена на рынке: 100 правильно распознанных изображений стоят всего $0.07 (около 2 рублей);»

Athari 25 апр 2014 в 11:44

Чтобы эти цены казались жестью, каким же злостным спамером нужно быть?

Отзывы от пиксодроме в инете какие-то неважные…

6opoDuJIo 17 апр 2014 в 23:57

Порой по 8 раз к ряду приходится перенабирать.

AxisPod 17 апр 2014 в 09:21

Ну капча от гугла, как и большинства других компаний/сайтов, это защита от людей, а не роботов, что в очередной раз сама же гугл и доказала.

Sequd 17 апр 2014 в 09:23

Скоро в обратную сторону пойдут. Ошибся, значит человек!

Sudno 18 апр 2014 в 08:41

И тогда роботов научат ошибаться!

chabapok 17 апр 2014 в 09:53

И так уже многим лень регистрировать аккаунты, а со сложными капчами этот процесс вообще превращается в ад. Пора уже придумать что-нибудь принципиально другое, что-то на замену капчи.

bolk 17 апр 2014 в 10:06

Придумали уже. «Авторизоваться через Фейсбук».

chabapok 17 апр 2014 в 10:17

Авторизация через сторонние сайты — далеко не всегда применимый способ. Например, в той же авторизации через фейсбук иногда хотят слишком много прав, которые неясно для чего нужны. Давать эти права не хотелось бы. Поэтому, часто я отказываюсь авторизоваться через фб.

НЛО прилетело и опубликовало эту надпись здесь

valplo 17 апр 2014 в 10:34

А если у меня нет фейсбука? Что мне, специально заводить его?

bolk 17 апр 2014 в 10:56

Нет, заводите везде новый логин, пароль и вводите каптчу.

varnav 21 апр 2014 в 09:52

Давно уже придумано.

Введите сколько будет дважды два (одна цифра): [ ]
Как называется наша планета? (5 букв): _____

и так далее.

SVlad 25 апр 2014 в 13:49

Опять же не масштабируется. Если все начнут использовать такую капчу, то база вопросов и ответов быстро утечёт. К тому же на некоторые вопросы и компьютер ответит.

varnav 26 апр 2014 в 06:50

Да нет никакой базы. У каждого форума свой набор вопросов-ответов.
А компьютер ответит только если он WolframAlpha и вопрос на английском.

SVlad 26 апр 2014 в 08:26

Это пока такая система не распрастранена. Если пойдёт в массы — будут базы. Собственно, и сейчас для каждого конкретного форума с такой защитой можно написать простого бота.
А на вышеприведённые вопросы гугл отвечает. То есть, ответ присутствует в первом результате рядом с текстом вопроса и его легко спарсить.

Tonis 17 апр 2014 в 09:54

Ну всё. Теперь они самодостаточны.

akamajoris 17 апр 2014 в 10:09

Скоро откроют свой сервис anticaptcha, будут брать деньги со спаммеров за разгадывание собственной капчи.

iTs 17 апр 2014 в 10:31

Есть уже такая, и не одна.

xpert13 17 апр 2014 в 12:08

Да, только там люди работают и разгадывают порой по несколько минут. А здесь робот, с высокой точностью и скоростью. Думается мне, что спамеры готовы за такое платить больше, чем людям :)

shoroh 17 апр 2014 в 10:15

А может, новый алгоритм распознавания как раз и заключается в том, что картинка отправляется «нейронной сети» из 100500 индусов? :)

chabapok 17 апр 2014 в 10:20

Это стандартный прием — достаточно просто подставить ее на сайт посещаемый как капчу или ее часть. Пользователь введет капчу — вот и картинка расшифрована.

SVlad 17 апр 2014 в 17:51

А вы никогда не встречали в системе reCaptcha номера домов? Вот это оно и есть.

Midas 17 апр 2014 в 11:09

Минуточку, а вот на рекапче не номера ли домов появились в последнее время?

vovkasolovev 17 апр 2014 в 11:12

Тсс! Это и есть новый алгоритм.

Midas 18 апр 2014 в 03:11

То то и оно.
Конечно понимаю, что в гугле работают талантливые умнейшие люди нашего времени, но как то не верю (ц) Станиславский.
Говорю это потому, что сам занимаюсь капчами в рамках проекта «Капча лаб».

middle 17 апр 2014 в 11:15

Уже давно. Google перешёл с оцифровки книг (изначальной цели reCaptcha) на распознавание номеров домов на Google Street View.

impass 17 апр 2014 в 19:14

Google перешёл с оцифровки книг (изначальной цели reCaptcha)

Неужто все книги уже оцифровали?

middle 17 апр 2014 в 19:18

Видимо, дома для Гугла важнее. Он не для того купил reCAPTCHA, чтобы книги оцифровывать…

eps 17 апр 2014 в 20:17

Книги для Гугла тоже важны — они говорили: «Мы оцифровываем их не для того, чтобы их читал человек. Мы оцифровываем их для того, чтобы их прочитал ИИ».

BelBES 18 апр 2014 в 07:31

Так наверно посмотрели на всю ту нецензурную брань, что вводят вместо слов из книг некоторые люди и решили, что ИИ такое читать вредно;) Вот и перешли на дома)

Homakov 17 апр 2014 в 11:28

hashcash лучше капчи

might 17 апр 2014 в 12:06

Да рекаптчу уже давно очень успешно расшифровывает хрумер.
Рекаптча — враг, боты её распознают, а вот у людей распознать её порой возникают проблемы.
Keycaptcha намного более эффективна как в защите от роботов, так и для удобства людей.

xpert13 17 апр 2014 в 12:12

Если мне не изменяет память, то хрумер разгадывает её с точностью то ли 80%, то ли 90%, но точно не 99,8%. В остальном, как по мне, то любая каптча зло, Keycaptcha в том числе. Лучше уж действительно авторизация через какой-то фейсбук.

might 17 апр 2014 в 12:15

Не все любят авторизовываться через соц.сети. Вот меня нет в фейсбуке и регистрироваться в нём ради того, чтобы где-нибудь оставить комментарий я не буду. Да и аккаунты соц.сетей регистрируют пачками, продают зарегистрированные или с фейков. Так что такую защиту обойти не составило бы труда.

xpert13 17 апр 2014 в 12:34

Не все любят авторизовываться через соц.сети. Вот меня нет в фейсбуке и регистрироваться в нём ради того, чтобы где-нибудь оставить комментарий я не буду.

Мне лучше один раз зарегистрироваться в соц. сети, вместо сотни вводов каптч.

Да и аккаунты соц.сетей регистрируют пачками, продают зарегистрированные или с фейков. Так что такую защиту обойти не составило бы труда.

Аккаунты пачками регистрируют, а каптчи миллионами разгадывают. Цена разгадывания одной каптчи на порядок меньше, чем цена одного аккаунта. Каптчи уже давно не помеха для спамеров. К тому же, если я не ошибаюсь, в фейсбуке идёт подтверждение по телефону, что уже сильно ограничивает максимальное количество аккаунтов, а если к этому добавить возможность жаловаться на спам от аккаунта, через который залогинились на сайте и оперативно банить такие аккаунты — то спам превратится в довольно дорогое занятие.

exIV 18 апр 2014 в 03:05

Вам изменяет память :) хрумер никогда не разгадывал кейкапчу. Пытался, да… даже релиз выпустил, но только он так и не работал, а в следующем же релизе выкосил все и сказал — «ну их нахрен» ибо это испоняемый код и что «прелетит» в следующий раз не известно :)

Авторизация через соцсети ФЭЙЛ и НЕ защита от спама… Один раз зарегистрировавшись в соц. сети бот может спамить на все форумы где есть такая авторизация… Другое дело что спамеры пока еще на промышленный поток это не взяли, но уверен, в ближайшие полгодика всех форумоводов ждет «приятный» сюрприз в виде массового появления соответствующих ботов (в том числе хрума).

xpert13 18 апр 2014 в 09:01

Вам изменяет память :) хрумер никогда не разгадывал кейкапчу. Пытался, да… даже релиз выпустил, но только он так и не работал, а в следующем же релизе выкосил все и сказал — «ну их нахрен» ибо это испоняемый код и что «прелетит» в следующий раз не известно :)

Речь шла о рекаптче, а не кейкаптче. might сказал, что хрумер уже давно её разгадывает, на что я ответил, что процент разгадывания был не на столько большой, чтобы сравнивать эти 2 новости.

Авторизация через соцсети ФЭЙЛ и НЕ защита от спама… Один раз зарегистрировавшись в соц. сети бот может спамить на все форумы где есть такая авторизация… Другое дело что спамеры пока еще на промышленный поток это не взяли, но уверен, в ближайшие полгодика всех форумоводов ждет «приятный» сюрприз в виде массового появления соответствующих ботов (в том числе хрума).

Я уже комментировал этот момент habrahabr.ru/post/219767/#comment_7504683

При желании очень сильно усложнить жизнь спамерам можно. Ну или хотя бы сделать цену за каждый спам-комментарий очень высокой.

exIV 18 апр 2014 в 09:22

Только процесс этот никак не может контроллироваться владельцем форума или какого-то сообщества. Только самой соц-сетью… А им знаете не до спама на сторонних ресурсах, им бы со спамом у себя разобраться. Вобщем имхо авторизация через соц-сети как средство борьбы со спамом, это путь «в никуда».

kostyl 17 апр 2014 в 12:18

Не знаю как кто, но я всегда вместо второго слова пишу некультурную брань…

EndUser 17 апр 2014 в 12:53

Зачем?

slimak 17 апр 2014 в 13:44

Менталитет, однако.
Человека бесплатно пытаются припахать распознавать что-то, значит надо саботировать процесс!

Krypt 17 апр 2014 в 19:04

Аналогично поступаю, с тех пор, как гугл стал подсовывать не читаемую картинку в 50% случаев. Я с ними никаких договоров на разгадывание рекапчи не заключал, а то, что они делают — это неуважение к пользователям.

Armin 17 апр 2014 в 13:21

Я, если не понимаю сходу, что там написано — пишу «абы что», но если понимаю — пишу верно.

EndUser 17 апр 2014 в 14:30

Там лёгкое слово распознаётся для пользы, а трудное собственно капча, если я верно понял.

BRADA 18 апр 2014 в 11:48

Скорее наоборот. Легкое слово гугл знает и проверяет народ на адекватность, а трудное сам распознать не может, и подсовывает людям сканы, фото и т.д. (которые не влияют на результат). Затем выбирает из ответов самый распространенный, считая это «правильным» для книг, номеров домов в картах и т.д.

nuskas 17 апр 2014 в 13:22

Недавно мне нужно было зарегистрироваться на одном китайском сервисе и для подтверждения, что я настоящий китаец, нужно было ввести капчу, 4 иероглифа!!! Вот тогда я прочувствовал все прелести китайской грамоты!

НЛО прилетело и опубликовало эту надпись здесь

Envek 18 апр 2014 в 13:21

Ну, в системе ключей ещё разобраться надо. К тому же можно менять шрифты на капче! Всякие скорописные там… Правда это отсеет и неплохой процент самих китайцев :-)

kpetob 17 апр 2014 в 14:55

Как-то баловался переводом с китайского. Вынуть текст из картинки иногда помогал сайт
www.chinese-tools.com/tools/mouse.html

С n-ного раза получалось нарисовать то, что требуется.

НЛО прилетело и опубликовало эту надпись здесь

BarsMonster 18 апр 2014 в 04:44

Посмотрим, как он справится с капчей на моем сайте

ploop 18 апр 2014 в 05:20

Проглядываются буквы A и g… но мутно как-то… :)

Dimchansky 28 апр 2014 в 10:32

Я тут немного с фильтрами поигрался, поресайзил и вот что получилось

Goobs 18 апр 2014 в 05:26

По чесноку, вы сами-то с ней справитесь? Мне лично слабо, мои глаза не способны распознать низкоконтрастные контуры, адово пережатые jpeg-ом.

sol_linux 18 апр 2014 в 05:47

76BW128?

ValdikSS 18 апр 2014 в 08:11

Она генерируется каждый раз.

vlivyur 18 апр 2014 в 06:07

Кто-нить уже зарегистрировался?

Meklon 18 апр 2014 в 06:34

Ой злая версия)) Хотя порадовала надпись ниже:

WARNING: Please ignore the image, and instead enter chemical symbol for Silver (case is ignored).

P.S. Мне кажется или правильнее «instead» перенести в конец предложения?

ploop 18 апр 2014 в 06:40

Кстати, такие варианты самые правильные. Но отсеивают добрую часть пользователей, не умеющих читать.
Аналогично — простая капча, но подпись «введите третью и пятую букву с картинки» в разных вариациях.

BarsMonster 18 апр 2014 в 06:57

«Но отсеивают добрую часть пользователей, не умеющих читать» — это вообще бесценная фича :-)
За всю историю (года 3) раза 2 мне в почту писали, жаловались на капчу.

SVlad 18 апр 2014 в 08:15

Проблема в том, что такая система не масштабируется. Пока она стоит на одном малоизвестном сайте, боты её не проходят. Но если задаться целью её обойти, то сделать это элементарно.

vlivyur 18 апр 2014 в 08:22

На паяльнике кажется была простенькая схема, где надо было подсчитать чему равняется тот или иной параметр в цепи.

BarsMonster 18 апр 2014 в 09:09

На flyback.org.ru — тоже схема, но не совсем простенькая :-)
И в симуляторе «в лоб» не просимулируешь — там использовались идеальные диоды, которых быстро в симуляторе (LTSpice) не нашел.
Минут 5 на капчу ушло :-)

рансформатор имеет коэффициент трансформации sqrt(2):1
R1=180ом R2=170ом R3=890ом. все элементы схемы идеальны, падение напряжение на диоде равно нулю
Входное напряжение: синусоидальное 50гц, с действующим значением 127В
Определите, сколько Дж энергии будет накоплено в конденсаторе C2?

Сейчас заметил, что адрес капчи у них статический…

MrShoor 18 апр 2014 в 13:23

Напомнило:

chabapok 18 апр 2014 в 11:56

так сверхалгоритмы можно научить понимать текст, и тогда бот может понять, что ему не надо парсить картинку. Мне кажется, научить понимать текст не на много сложней, чем считывать инфу с картинки.

quarantino 20 апр 2014 в 07:25

Когда боты научатся понимать текст и сами начнут отвечать на вопросы, люди станут не нужны.

klikalka 20 апр 2014 в 09:17

Ну вот, теперь будет двухфакторная регистрация/авторизация на большинстве крупных и не очень порталов.
Наверное, будет выводиться капча и надо будет в определённом порядке, высланном по смс, впечатывать символы с капчи на экране.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий