SLY_G Feb 8 2019 at 12:14

Почему капчи стали такими сложными

6 min

43K

Information Security*Artificial Intelligence

Translation

+30

153

Comments 153

vassabi Feb 8 2019 at 12:23

схему, в которой используются оптические иллюзии и логические задачки, с которыми тяжело справляться людям. Этот тест называется «тест Тьюринга через ошибку», и единственный способ пройти его – дать неверный ответ.

Всегда проще эмулировать человеческие ошибки, чем человеческую правильность.

turone Feb 8 2019 at 16:44

Гугл тоже эту фишку использует в своей капче при выборе картинок — я заметил, что если быстро все выбираешь то капчу можешь раз 10 проходить, а если делаешь паузы при выборе картинок, то с первого раза проходишь (но когда спешишь, то десятый круг вопринимаешь как издевательство).

xakep2011 Feb 8 2019 at 16:51

О да, до боли знакомо. Самая большая боль, когда всё это происходит во встроенном браузере какого-нибудь приложения на телефоне с медленным интернетом.

Всегда интересна была начинка и реверс-инжиниринг современной рекапчи.

Myosotis Feb 8 2019 at 18:58

Спасибо за этот лайф-хак, теперь буду чуть медленнее отмечать сфетофоры.

dartraiden Feb 10 2019 at 13:54

Ещё помогает отмечать ровно три квадратика, когда капча вида "выберите все участки, где есть дорожные знаки". Если выбрать больше или меньше — выше вероятность не пройти.

Stepan555 Feb 9 2019 at 10:50

Ошибки у всех разные. Кто-то 2+2 сложить не может. А как только выявится ошибка, которую делает каждый человек, так её сразу научатся делать и роботы.

VelikiyYaroslav Feb 9 2019 at 18:21

Есть ряд исследований показывающих, нейронные сети не склонны к распознаванию иллюзий (в частности перевод на хабре: habr.com/ru/post/427947). Не склонны в том плане — что у людей достаточно ограниченный спектр таких иллюзий их проявление в нашем восприятии сильно зависит от контекста при том, что у нас не снижаеться способность распознавать другие образы. А нейронные сити в основном подвержены иллюзиям только при сниженной эффективносит (и илююзии у них несколко другие).
Так что если давать в перемешку задания с иллюзиями и нормальные задания, то это может иметь смысл.

DrPass Feb 10 2019 at 01:02

Есть ряд исследований показывающих, нейронные сети не склонны к распознаванию иллюзий

Это сугубо инженерная задача. Просто надо кому-то потратить больше времени для подготовки тренировочной базы данных для нейросети, чем было в тех исследованиях.

AssMoFun Feb 8 2019 at 12:34

Предлагаю в качесте капчи использоват шутки (либо другие тексты, вызывающие человеческие эмоции). В ответах надо выбрать вариант, наиболее подходящий под заданую шутку (текст, вызывающий эмоцию).

kinall Feb 8 2019 at 12:51

Ага, и будете разгадывать истинно британский юмор… Ну или индийский))

AssMoFun Feb 8 2019 at 14:02

В Англии фраза вроде «Да ты юмора не понял» является чуть ли не оскорблением)) Так что имхо лучше юмор подучить, чем фото светофоров/зебр/витрин заучивать.

kinall Feb 8 2019 at 16:01

А какая разница, что там где-то считается оскорблением?

Wolframium13 Feb 8 2019 at 13:02

Юмор у всех разный. Столкнётесь с вопросом
«Заходит англичанин в бар:
а) а он ему как раз
б) а там армяне в нарды играют
в) а в бухгалтерии всё перепутали
и будете чесать затылок.

AssMoFun Feb 8 2019 at 14:04

Для тех, кто пока плохо умеет в юмор, первая ссылка в Гугле www.google.com/search?client=firefox-b-d&q=%D0%97%D0%B0%D1%85%D0%BE%D0%B4%D0%B8%D1%82+%D0%B0%D0%BD%D0%B3%D0%BB%D0%B8%D1%87%D0%B0%D0%BD%D0%B8%D0%BD+%D0%B2+%D0%B1%D0%B0%D1%80

UFO just landed and posted this here

AssMoFun Feb 8 2019 at 16:10

Вам ~~шашечки~~ шутки смешные, или ответ на капчу ?))

ExplosiveZ Feb 8 2019 at 17:06

На самом деле, все ответы подходят. Это анекдот категории /б/

BubaVV Feb 8 2019 at 13:11

Купил мужик шляпу, а она ему как раз

atomlib Feb 8 2019 at 13:50

— Финансовый анализ поглощения Red Hat компанией IBM, 2018

Denai Feb 8 2019 at 14:06

роботам будет такое разгадывать ещё проще

Myosotis Feb 8 2019 at 19:02

Да, можно обучать нейросеть так, что будет понятен контекст и робот сможет продолжить фразу.

NineStars Feb 10 2019 at 11:48

Повезло же бедолагам с неразвитым эмоциональным интеллектом — не пройти им капчи

Ramisya4ka Feb 10 2019 at 11:48

К сожалению, существую люди без чувства юмора и даже объективно смешная штука кажется не смешной. И наоборот, существую люди, которые смеются над всякой дичью (над которой адекватный человек не будет смеяться), а над нормальными шутками — нет.

UFO just landed and posted this here

LazyTalent Feb 8 2019 at 13:26

Очень часто сталкиваюсь, что через сайт бывает «сложно» вытащить данные (капча, всевозможные динамические токены, необходимы паузы между запросами итд), а вот с API для мобильного приложения — твори что и как хочешь.

dfgwer Feb 9 2019 at 11:25

акселерометр? Хотя нет, проблемы если мобильник лежит на столе.

nikolayv81 Feb 12 2019 at 19:39

К нему ещё доступ получить нужно.
Эта рекапча тем и достаёт, что картинки подставляет людям которые не хотят постоянно сдавать анализы гуглу (блокируются их скрипты и часть доменов, а также отсылка "личной" информации).
При этом все страшилки про роботов на некоторых сайтах больше похожи на прикрытие для сбора информации.

bfDeveloper Feb 8 2019 at 12:57

Почему-то представил себе антиутопию, в которой люди борются за право оставаться людьми, введя специальные курсы в школах для прохождения капчи. Что-то основанное на задачах, которые мозг решает лучше процессора, но уже настолько сложное, что нетренированный человек не в состоянии это сделать. И постоянная гонка со слабым ИИ за эффективность. Учись или сольёшься с безликой массой людей и роботов.

UFO just landed and posted this here

Victor_koly Feb 8 2019 at 15:07

Знаете идею типа «Если у власти станут програмисты, то целые отделы министерств заменит короткий скрипт»?

UFO just landed and posted this here

JamboJet Feb 8 2019 at 17:29

Решение проблемы бездомных и голодающих — накормить голодающих биомассой сделанной из бездомных.

svboobnov Feb 8 2019 at 20:18

При перегруженности планеты человеками — один из оптимальных вариантов, кстати.

Darth_Biomech Feb 10 2019 at 06:29

Soylent Green is people!

KvanTTT Feb 23 2019 at 02:29

А может даже обеспечить бездомных жилищами, сделанных из биомассы голодающих?

amarao Feb 8 2019 at 15:49

… А так же восемь отделов по CI/CD pipelines, QA, SRE & DevOps для этого скрипта.

Victor_koly Feb 8 2019 at 16:05

А секретарей министерства перевести в Support?

amarao Feb 8 2019 at 16:12

Секретарь — довольно высокая позиция.

Очевидно, что L1, L2 и L3 саппорт, QA, manual & automation, UI/UX, бэкэнд, фронт-энд, DBA, сетевой отдел, on-site, etc. А ещё они все пользуются компьютерами и нужна авторизация, VPN, принтеры, wifi'и, бэкапы и т.д.

Человек 200, и это в условиях острой нехватки сотрудников. А они «скрипт, крипт».

Victor_koly Feb 8 2019 at 16:39

Вот у нас была техподдержка. По отзывам клиентов — ~~ничего не шарящие~~ студенты. Они уже отправляли задачи техн. специалистам.
В зависимости от задачи это было 4-5 человек на решение разных задач:
— телефония (2 специалиста);
— интернет (оптика/UTP) и КПД (это именно сетевики с логической стороны, не прокладка оптики по городу);
— частиный случай — инет через ADSL;
— сайты, почта и хостинг.

Victor_koly Feb 8 2019 at 13:03

Ну тогда нужно в капче решить квадратное уравнение. А лучше — уравнение
x²y" + axy' + by = f(x),
с комплексными собственными числами.

UFO just landed and posted this here

dubakov Feb 8 2019 at 13:12

www.wolframalpha.com/input/?i=f(x)%3Dx2y%22+%2B+axy%27+%2B+by

А вот большинство людей не решит

Victor_koly Feb 8 2019 at 15:16

Я вижу «ODE classification». Хорошо. Вы через онлайн-сервис определили тип ДУ (правда левой части). Я не спорю, что Matlab функцией dsolve решит даже ЛНДУ 2го порядка. Но не всякий сможет написать прогу, которая символы капчи загоняет в «математический процессор».
P.S. Частный случай моего уравнения (иногда дает решить «подбором») — функция f(x) есть полином степени не выше, чем наибольшее собственное число однородного уравнения. Только если собственные числа таки комплексные, а справа полином — нет простых методов решения.

dubakov Feb 8 2019 at 15:20

А не надо чтобы «всякий» написал. Достаточно чтобы написал один.

И я так и не понял, как обычные люди будут решать, без образования.

mayorovp Feb 8 2019 at 19:48

Так прогу скачают же!

maxzhurkin Feb 8 2019 at 21:30

Робота купят

Jogger Feb 9 2019 at 00:53

Ну так отлично! Тех кто решил — отсеиваем, остальные люди.

rsashka Feb 8 2019 at 13:12

Думаю, что в скором времени это может решиться обязательной идентификацией интернет пользователя.

Кстати, совсем недавно встречал сайт, на котором капча стояла для просмотра материалов.

UFO just landed and posted this here

kasthack_phoenix Feb 8 2019 at 15:11

Кстати, совсем недавно встречал сайт, на котором капча стояла для просмотра материалов.

За Cloudflare?

rsashka Feb 8 2019 at 15:55

Не знаю.
Я переходил с поисковика и даже сам сайт не запомнил.
Просто закрыл страницу и перешел по следующей ссылке в поисковой выдаче.

masai Feb 8 2019 at 16:37

Думаю, что в скором времени это может решиться обязательной идентификацией интернет пользователя.

А что помешает ботам работать с учётки какого-то постороннего человека?

rsashka Feb 8 2019 at 16:48

Тут вопрос в строгости.
Если будет доступ со строгой криптографической аутентификацией с помощью ключа, выданного товарищем майором, то вряд ли найдется много желающих предоставить свою учётку для бота (надеюсь понятно, что это сарказм?) ;-)

boroda_el Feb 8 2019 at 17:53

Да ладно. Уже сейчас люди готовы на 5тыс на себя фирму зарегать для обналички, а тут какой-то ключ от инета.

NetBUG Feb 8 2019 at 16:48

Да, это печальная тенденция с постоянными попытками привязаться к телефону пользователей.

masai Feb 8 2019 at 16:54

Печальная и не особо помогающая, в общем-то.

Rikkitik Feb 8 2019 at 23:10

недавно встречал сайт, на котором капча стояла для просмотра материалов

Мне сегодня такая площадка в реале встретилась. У вас в городе в феврале обычно работает ярмарка «Мир самоцветов» с горами всяких каменных безделушек и всевозможной бижутерии, как китайской, так и авторской. Народ перед 8 марта там обычно кишит и массово затаривается побрякушками на подарки. И вот вижу я сегодня афишу, решаю зайти, а там… вход сделали платный, и аж два посетителя гуляет. Ну что ж, удачи, ребятушки, не очень-то и хотелось, магазин сувениров в 20 метрах скажет вам спасибо за рекламу… Думаю, с сайтами это так же работает.

UFO just landed and posted this here

Rikkitik Feb 9 2019 at 15:59

Это вы так предполагаете? Потому что в нашем городе речи про каждый раз нет, до сих пор всё было бесплатно, это не выставка, а именно ярмарка со столами, заваленными товаром и с продавцами, нахваливающими свой товар. А теперь на входе стоит стол с вахтёршей с советским лицом и бумажкой с ценой. И люди, уверенно шедшие к входу, увидев её, пожиамают плечами, разворачиваются и уходят (прямо как я), даже не узнав, есть ли там какие-то супер-плюшки. Про занимается этим постоянно не очень понимаю. Хранить флаер, чтоб в следующем году бесплатно зайти и поискать подарок — это какой-то сюр. Есть сто других мест, где можно зайти и прицениться бесплатно круглый год, и товар там в принципе тот же, ремесленники свои творения же весь год через магазины сбывают.

UFO just landed and posted this here

Rikkitik Feb 9 2019 at 22:07

Хорошо у вас там, в культурной столице. Выставки камней каждый месяц. И другие всякие интересности каждый день где-нибудь да есть. Не то, что у нас в Спарте. У вас, небось, и воскресенье бывает каждую неделю, а у нас только по нечётным…

nikolayv81 Feb 12 2019 at 19:48

Иногда так делают чтобы бомжей и мелких воришек оттолкнуть от идеи посещения, но это для тех случаев в которых действительно есть уверенность что люди придут.

DrPass Feb 8 2019 at 13:19

Реальный человек не очень хорошо контролирует моторику, и не может двигать мыш одинаковым образом много раз во время нескольких взаимодействий, даже если будет пытаться сделать это», — говорит Госмахумдер. Робот будет взаимодействовать со страницей, не двигая мышью, или двигая её очень точно, а в действиях человека будет наблюдаться «энтропия», которую сложно подделать

А почему её сложно подделать? По-моему, эта задача на порядок проще, чем распознавание образов на картинках.

xdtb Feb 9 2019 at 06:32

Так и есть. Сделать аналог взламываемого сайта, прокрутить там пару тысяч человек и собрать статистику как кто двигает мышью проще пареной репы. Гугл сядет в лужу с этой новой схемой. По крайней мере простому программисту без особых мат. знаний станет возможным симулировать поведение человека в браузере.

MOPOH Feb 8 2019 at 14:37

Из-за впн периодически просят ввести капчу при поисковых запросах. Если это Яндекс, то мне проще перейти в Гугл и там нажать на несколько квадратиков, чем раз за разом пытаться правильно набрать капчу Яндекса. Хотя должен признать, что поиск по картинке у последнего лучше.

nikolayv81 Feb 12 2019 at 19:50

Обычно это делает гугл, особенно если у вас не хром и заблокированы гуглосборщики информации.

rustacean137 Feb 23 2019 at 03:15

По моему, с VPN лучше использовать duckduckgo.com (т.к. капчи нет), если неудачно, то можно переключиться на другие поисковики.

Alexey2005 Feb 8 2019 at 15:19

А ведь сражаются-то со следствием, а не с причиной. Капча является прямым следствием существования маркетологов, и если каким-то образом удастся сократить их поголовье в сети, то и никакие капчи не понадобятся.

Perlovich Feb 8 2019 at 15:47

Я всегда думал, что капча нужна, чтобы отсеять ботов, а не маркетологов :-)

amarao Feb 8 2019 at 15:48

Маркетолог — человек, занимающийся изучением рынков для товаров. Каким образом поголовное уничтожение маркетологов уберёт задачу каптчи на -цатую неудачную попытку ввести пароль?

Alexey2005 Feb 8 2019 at 17:34

Если бы он занимался именно пассивным изучением, то и вреда от него было бы куда меньше.
К сожалению, маркетолог занимается активным влиянием на рынок, и вот это уже проблема. Именно эти люди заказывают спам-рассылки, заказывают написание кравлеров, различных ботов для всевозможных накруток и т.д.
И именно защита от всего этого — основная задача капчи. А «капча на неудачный пароль» — это какой-то экзотический случай, с которым пользователь будет сталкиваться максимум раз в полгода.

amarao Feb 8 2019 at 18:48

Последний раз, когда я видел массовую рассылку, она предлагала сдать пароль от гугля. Это тоже маркетологи? Рассылка малвари? Брут-форс промо-кодов? Регистрация фейковых аккаунтов в социальных сетях с целью демонстрации любви к действующему перзиденту?

Это всё маркетологи? Я не понимаю вас.

amarao Feb 8 2019 at 15:46

Оптические иллюзии — это интересно, но их мало.

UFO just landed and posted this here

amarao Feb 8 2019 at 17:07

Для роботов мало. И я не про «какого цвета платье», я про однозначные. Например:
(выберите картинки, на которых что-то двигается)

force Feb 8 2019 at 17:47

Проблема с этими картинками, что таких картинок ограниченное количество, соответственно, боту просто надо их все выучить. А если мы научимся генерить подобные картинки массово, то у нас будут правила их генерации и какой-то паттерн результата. Боты опять же будут распознавать эти паттерны.

amarao Feb 8 2019 at 18:53

Именно с этого я и начал. Идея хорошая (потому что сейчас оптические иллюзии — это то что точно отличает человека от робота), но очень маленькая выборка.

… Кто-то пробовал тренировать нейронку по признаку оптической иллюзии?

Victor_koly Feb 8 2019 at 19:08

Была подобная статья на Хабре:
habr.com/ru/post/427947

В последние годы машины научились распознавать объекты и лица на изображениях, а потом создавать похожие изображения. Легко представить, что система машинного зрения должна суметь распознавать иллюзии и создавать свои собственные.

Ну и написали 2 мужика короткую статью. Вышел некий «процесс создания иллюзии»:

Картинка

amarao Feb 8 2019 at 19:28

Моя нейронная сеть их нейронная сеть не понимать. Что это?

Sabubu Feb 8 2019 at 19:19

Отличная картинка. Гоняясь взглядом по картинке, чувствуешь себя котом, который догоняет и накрывает лапами пятно от лазера, а там ничего нет.

andyudol Feb 10 2019 at 17:43

А если не гоняться, она останавливается.

Spaceoddity Feb 8 2019 at 17:12

Помню усложняли мы как-то капчу с нашим ведущим программистом. И он мне объяснял логику — нам не надо сделать капчу абсолютно нераспознаваемой для машины (и заодно увеличив трудность распознавания её человеком), нам надо лишь на несколько процентов повысить сложность распознавания капчи машиной — что в свою очередь на порядок повысит отсееваемость ботов.

ufm Feb 8 2019 at 17:42

По всей видимости я один не понимаю — зачем капча вобще нужна? Если вам нужна капча, что-бы отличить роботов от людей на своём ресурсе, значит вы что-то делаете кардинально неправильно.

boroda_el Feb 8 2019 at 17:59

нужно делать сайт для роботов, а жалким людишкам на него вход закрыть.

rsashka Feb 8 2019 at 18:00

А капча нужна не для того, что бы отличать робота от пользователя.
Ведь под «роботами» понимаю скрипты для автоматизации определенных действий, например, рассылку спама в комментариях и формах обратной связи. В этом случае капча будет нужна для того, что бы приблизить стоимость выполнения действия скриптом к стоимости выполнения этого же действия человеком (превысить эту величину нельзя, т.к. будет проще нанять людей для распознавания капчи).

ufm Feb 8 2019 at 18:12

Повторюсь — если можно сделать «рассылку спама в комментариях и формах обратной связи» — значит что-то сделано кардинально неправильно. Ну хорошо, придумали неломаемую компьютером капчу, все начали ей пользоваться и что? Да, рассылка спама станет дороже, потому что это станут делать люди. Все кто пользовался рассылкой спама — просто станут платить больше. И?

ExplosiveZ Feb 8 2019 at 18:25

Ну и чего «кардинально неправильного» в обычном, скажем, phpBB форуме?

egigd Feb 9 2019 at 04:52

Почтовые сервисы крайне эффективно автоматически выявляют спам и удаляют его, а затем блокируют их рассыльщиков.
Добавляем тоже самое в форумы (для улучшения статистической выборки делаем какую-то общую для вех форумов базу спам-сообщений) — и нет проблем.
Конечно, какие-то отдельные спам-сообщения всё-таки пройдут, но их будет мизер.

nikolayv81 Feb 12 2019 at 20:01

Неможерируемый форум? Очень необычная штука в современном мире. Человек вам, как владельцу, может сделать гораздо "хуже" чем бот.

rsashka Feb 8 2019 at 18:33

Можно сделать правильно, что бы формы отправлялись только авторизированными пользователя, с кармой больше 5, с предварительной модерацией и с электронной подписью заверенного сообщения.
Это будет кардинально правильный сайт, вот только там сообщений будет 0.
А значит не будет и обратной связи от настоящий пользователей.
Поэтому использование капчи, это всегда компромисс между удобством использования и назойливостью от внимания «роботов».

selivanov_pavel Feb 8 2019 at 19:42

1. Защита от спама. Иногда нужно дать возможность написать комментарий или сделать заказ неавторизованному пользователю, потому что регистрация снизит конверсию на порядок. И при этом не хочется, чтобы конкуренты или хулиганы наплодили тысячи спам-коментов с неприличным контентом или тысячи фейковых заказов, в которых потонут настоящие.

2. Защита от DDOS. Всё, что выдаётся неавторизованному пользователю — кешируется. А всё, что кешировать нельзя и потребуется дёргать приложение(проверка пароля, например) — закрывается капчей. И боты долбят отдающие закешированные данные nginx/varnish/..., а не приложение и базу.

Balek Feb 8 2019 at 20:09

Почему бы не направить усилия на распознавание зловреда вместо того, чтобы мучить людей решением ваших проблем? В статье много написано про выкрутасы с ИИ. Но распознавание спама выглядит куда более простой задачей для ИИ. И обойти защиту значительно сложнее, чем распознавать любую капчу, потому что текст должен быть рекламным. По-моему, это очередной пример, когда настоящую задачу подменяют какой-то технической мурой.

rsashka Feb 8 2019 at 20:30

Потому что «зловред» не придумывает тексты. Рекламные тексты создают такие же люди, просто автоматизируют их создание по определенному алгоритму. И решается задача не «распознать спамерский текст», а усложнить (читай сделать дороже), рассылку спама.
Ведь защита от ботов может потребоваться не в абсолютном смысле (иначе будут спамить не роботы, а реальные люди), а относительная, по сравнению с другими аналогичными ресурсами, например, конкурентов.
Если конкурентов заспамили, что реальных пользователей не видать, у а тебя хоть и бывает проскакивает зловред, но чуть-чуть, тогда твой ресурс выигрывает за счет притока реальных людей.

selivanov_pavel Feb 8 2019 at 21:35

Потому что прикрутить капчу чуть-чуть проще, чем создать сильный ИИ.

Balek Feb 8 2019 at 21:42

Я о том и говорю, что когда-то это было нормальным решением. Но если сейчас капча требует того же ИИ для её создания и доставляет настоящую боль пользователям, то нужно вернуться к изначальной задаче и подумать ещё раз. Для распознавания спама сильный ИИ не нужен. Задача явно не сложнее создания спама. Начнём с того, что у нас изначально есть очень хороший признак для классификации текстов — наличие URL'а. 80% результата уже достигнуто. Дальше уже тренируйте нейронные сети и прочее.

selivanov_pavel Feb 8 2019 at 21:52

Для владельцев сайтов капча — просто подключаемый сервис. Когда сделают ИИ, который можно будет так же подключать как сервис и который будет отсеивать спам-
ботов с той же эффективностью — все тут же на него перейдут.

Тренировать нейронные сети и так далее — явно не задача для владельца какого-нибудь форума или интернет-магазина.

> Задача явно не сложнее создания спама.

То-то в почтовых сервисах Гугла и Яндекса над этим работают целые отделы, и всё равно есть заметный процент промахов и ложных срабатываний. Если вы способны сделать ИИ для качественного отсеивания спама с той же лёгкостью, с какой любой минимально знакомый с программированием человек может сделать бота для его рассылки — вы сказочно обогатитесь.

Balek Feb 8 2019 at 22:04

Для владельцев сайтов капча — просто подключаемый сервис.

Мы же обсуждаем разработку капчи, а не людей, которые подключают сторонний сервис.

То-то в почтовых сервисах Гугла и Яндекса над этим работают целые отделы

Всё-таки для почты эта задача мне кажется сложнее, чем для сайтов. Да и справляются фильтры сегодня весьма хорошо. И с капчой есть «заметный процент промахов и ложных срабатываний». Если точнее — капча справляется гораздо хуже.

selivanov_pavel Feb 8 2019 at 22:17

В чём принципиальная разница между спамом в почту и на сайтах? Ну кроме того, что в почте спам мошеннический и коммерческий, а на сайтах ещё и хулиганский.

Balek Feb 8 2019 at 22:33

В отсутствии разрешённых роботов: почтовых рассылок, уведомлений и прочего. В меньшем разбросе контекста и вообще более узком диапазоне использования.

egigd Feb 9 2019 at 04:54

Как-то почтовики 99% спама без сильного ИИ вылавливают…

UFO just landed and posted this here

egigd Feb 9 2019 at 22:06

Так контент-то и так свободно открыт, это же не почта, в чём проблема «сливать»?..

UFO just landed and posted this here

Mladolaborant Feb 9 2019 at 04:49

Исходя из моего скромного опыта, задачу защиты от всякой гадости в 80% случаев успешно решает банальный Spam Assassin, прикрученный ржавой колючей проволокой к вашей любимой форме. А оставшиеся 5% — любым скриптом для потрошения логов и бана по IP тех, кто эту форму абузит. И это я не говорю про такие классические решения как бан за попытку залезть в honeypot в форме, или тарпиттинг через тот же honeypot.
Учитывая отношение современной капчи к пользователю, особенно когда что-то надо вотпрямщас — её использование в явном виде воспринимается как личное оскорбление.

И боты долбят отдающие закешированные данные nginx/varnish/..., а не приложение и базу.

А пользователи уходят куда-нибудь в другое место…

selivanov_pavel Feb 9 2019 at 16:42

Во-первых, сейчас за одним NAT IP кроме бота может сидеть куча добросовестных пользователей. И для некоторых видов сервисов важана доступность для всех пользователей.

Во-вторых, увидев timeout или 503/504, 100% пользователей уходят куда-нибудь в другое место. Разумеется, включать капчу надо только на время DDOS.

svboobnov Feb 8 2019 at 20:07

Капча нужна для повышения стоимости спама. В пределе нужна такая техника:
Роботам можно подложить «фальшивый сайт». То есть спамерский скрипт вывалит свой спам на площадку для роботов, скрипт, который контролирует работу роботов проверит наличие комментариев на «роботской» копии ресурса, заказик спама заплатит за размещение спама, а вот на «человеческой» копии ресурса спам не появится. То есть стоимость $1, эффекта — 0, и соотношение цена/качество = $1/0 = ∞

AngReload Feb 8 2019 at 21:20

Вы описали идеальный shadowban.

vitaliy2 Feb 9 2019 at 17:27

А как понять, кто из них роботы?

nafnaf21 Feb 10 2019 at 11:49

Так, что бы роботам подложить «фальшивый сайт», нужно определить, что они роботы.Капча как бы для этого и применяется, что бы отделить людей от роботов.

svboobnov Feb 8 2019 at 20:02

Хм, у меня когда-то был QIP, и в приглашении «антиспама» был вопрос: «Докажите, что Вы не робот, и ответьте на вопрос: Чем едят суп?», при этом, в возможных ответах (с которыми сравнивает QIP) я указал «ложкой», «ложка», «ложкою», «ложечка», «ложечкой» и т.п… И вот: примерно 3/4 всех желающих со мной пообщаться этот простенький «антиспам» отсеивал. Многие из отсеянных «спамеров» были реальные люди, в том числе и мои коллеги, которые высказывали мне жалобы на «непроходимый» антиспам. И это обычный текстовый вопрос, предполагающий знакомство человека с супом, тарелкой и ложкой.
Кажется, боты стали умнее людей.

selivanov_pavel Feb 8 2019 at 21:25

Ртом :)

Taciturn Feb 8 2019 at 23:01

У меня было

Чтобы я смог с вами поговорить ответьте, написав "nospam" (с кавычками).

, ни один робот не прошёл, из людей никто не жаловался.

UFO just landed and posted this here

shm-vadim Feb 9 2019 at 11:51

Уже полгода наблюдаю по логам, как на моем сайте скрипт с разных ip-шников заполняет и отправляет регистрационную форму, а потом, без подтверждения адреса эл. почты, переходит на страницу авторизации безуспешно пытается по этим данным войти на сайт.
И лично меня не покидает устойчивое ощущение, что этот робот в свое время был настроен человеком, т.к. его действия, по сути, представляют собой мини-программу, адаптированную конкретно под мои авторизационные страницы/формы.
А в таком случае ваш метод вряд ли поможет.

vitaliy2 Feb 9 2019 at 17:21

В Японии суп едят палочками, а жидкость супа пьют с посудины. Там даже говорят не «съесть суп», а «выпить суп» (飲む), сказать «съесть суп» нельзя. Во многих других странах также едят палочками (Вьетнам, думаю, Корея, Китай и т. д.). Хотя ложкой тоже, вроде, иногда едят (по крайней мере в Японии).

BalinTomsk Feb 8 2019 at 21:49

эффект Манделы. Если нет, то это совпадение у нескольких людей воспоминаний, противоречащих реальной истории и нынешнему положению дел. Этакая массовая ложная память, ну или частичная подмена реальности. Примеров этого эффекта масса, в том числе и в старых советских фильмах

Уж на что я считал себя знатоком нашего кино, все фразы наизусть знаю, а прокололся в этом тесте. И не раз.

dubikvit.livejournal.com/735770.html

UFO just landed and posted this here

vitaliy2 Feb 9 2019 at 17:19

Если у меня есть рейтинг, что мне мешает брутить чужие пароли? Рейтинг же не будет падать. А если будет, как понять, что сайт не обманывает? Ну сама система может конечно какие-то проверки делать, но она, к примеру, не может определить, является комментарий спамом или нет. Хотя логины определить можно. Но полностью универсальной её сделать тяжело.

Также проблема анонимности. Если я хочу зайти на сайт анонимно, я не буду пользоваться никакой системой, и рейтинга у меня никакого не будет, иначе моя личность сразу будет раскрыта. В итоге у меня нулевой рейтинг.

Kardy Feb 9 2019 at 00:08

Капча «следующего поколения» должна задействовать абстрактное или пространственное мышление. То чего пока не достает роботам. Например — пользователю показывается рисуночек случайной химеры (кентавр, грифон, утконосоавтомобиль) составленная из двух животных (или еще чего похлеще).
Пользователь должен выбрать из пяти рисунков реальных животных те из которых составлена его химера.
Пока вижу единственное слабое место — если исходных вариантов мало — компьютер может не решать загадку честно, а тупо запомнить все комбинации.

redpax Feb 9 2019 at 13:20

Поздравляю вы придумали уже давно придуманый тест «Роршеха» и да его как раз не все люди способны пройти.

Jogger Feb 9 2019 at 01:01

такие капчи с культурной привязкой нацелены не только на роботов, но и на людей из других стран, решающих капчи за копейки.

Все почему-то не заметили эту фразу, а это имхо в статье самое главное. Капчи уже давно не пытаются различить ботов и людей. Они пытаются различить людей первого сорта и людей второго сорта. И это реально страшно.

Inpassor Feb 9 2019 at 01:36

Спасибо за статью, интересно!
Мне re-captcha ни разу не предлагала выбирать на каких-то картинках какие-то витрины, поэтому я никогда не понимал мемы на эту тему. Теперь хоть яснее стало :)

UFO just landed and posted this here

Inpassor Feb 10 2019 at 23:05

Да, спасибо! Я это понял :)
Это хорошо. Мне совершенно нечего скрывать. А то, что есть, никогда не будет напечатано, произнесено по телефону, передано по сетям…

polearnik Feb 12 2019 at 11:49

скиньте пожалуйста переписку в соцсетях и фотки кредитной карты.

nikolayv81 Feb 13 2019 at 08:14

Там вполне могут быть "с днём рождения" или совсем пусто.

egigd Feb 9 2019 at 05:01

А зачем мы вообще пытаемся разделить людей и роботов?..
Давайте, может, будем разделять допустимые и недопустимые действия, независимо от того, человек их делает или робот?

Если робот зашёл на форум и в теме «Анекдоты у костра» раз в день постит случайный анекдот, а в теме «Котики» — случайное фото кота, то чего нам ему мешать?
А если человек пишет в этих же темах «курсовые для студентов, быстро и качественно, размещайте заказ на сайте» — он требует очереди из плюсомёта

DGN Feb 9 2019 at 09:20

Цель работы форума «анекдоты» в том, чтоб показать людям рекламу. Если анекдоты пишут и читают боты, то сайт зазря жгет электричество и трафик.

Плюсомет оружие во первых дорогое (человеческий ресурс), а во вторых действует уже по факту поста, когда аудитория его уже прочитала. Использование же премодерации снижает конверсию.

egigd Feb 9 2019 at 21:22

Если цель форума в показе рекламы — пусть боты его и читают, людям там делать нечего.
Реклама может быть на человеческом форуме, но лишь как средство обеспечения финансирования непосредственно цели работы форума, а не заменять собой эту цель.

DGN Feb 10 2019 at 14:01

Это большой философский и этический вопрос. Каждая коммерческая компания выбирает свой оптимум на линейке, где с одной стороны «прибыль», а с другой «делать мир лучше».

nikolayv81 Feb 13 2019 at 08:17

И вот reCapcha, на мой взгляд, пытается убедить вас что linux + ff + блокеры скриптов гугла и рекламы — только мешают вам жить, даже на странице поиска гугл.

Victor_koly Feb 13 2019 at 09:37

Гугл конечно следит за мной в Хроме. Зашел в почту — сразу этот экземпляр Хрома начинает все сливать в общую базу на твой аккаунт. Например — в запросе поиска внезапно выскакивают книги на СИ, которые я читал с компа.

redpax Feb 9 2019 at 12:51

Гифки нужно в капче проигрывать, где происходит какоето действие с очевидным эмоциональным окрасом, например «убийство» или «грусть» или «любовь», что-нибуть явное в плане эмоций для человека и совсем не ясное для машинного алгоритма.

mikelavr Feb 9 2019 at 17:09

Эту капчу не пройдут люди с аутическими синдромами.

0xC0CAC01A Feb 9 2019 at 13:17

Кстати, а почему в каптче с кликанием на светофоры, пока они не перестануть появляться, новые картинки появляются не мгновенно, а с секундной задержкой? Ботам, я думаю, подождать не проблема, а вот людей это ожидание реально выбешивает, вряд ли я один такой. Гугл, прекрати нанимать идиотов в отдел каптчи!

mmmm1998 Feb 10 2019 at 11:49

Наверное по той же причине, почему в большей части современных ОС при вводе неправильного пароля о его неправильности сообщается с задержкой, тоже секундной. И точно также, как можно автоматизировать подбор пароля (если этой задрежки не стоит) при помощи программируемого контроллера, имитирующего клавиатуру, можно, видимо, как-то упростить разгадывание капчи, вероятно, за счёт ускорение скорости разгадывания на порядок, или даже на два.

vitaliy2 Feb 9 2019 at 17:09

Ненавижу каптчу гугл, поганые картинки приходится выбирать по 20 раз. Ввод одной каптчи может занять 10 минут. И каково будет Ваше удивление, когда она покажется снова. Чаще всего отказываюсь от сервисов, где есть эта каптча.

Также картинки появляются не сразу, а приходится ждать по 10 секунд, когда соизволит появиться картинка. А ведь за одно изображение таких появлений будет даже не одно, а несколько штук. А самих изображений тоже несколько.

Самое интересное, что поганая капчта иногда показывается просто при входе на какой-то сайт. Вас что, ддосят именно сейчас что ли? Никогда не поверю. Отдать страницу стоит 0.0000001 коп. Нафига автор тогда создавал сайт?

ReFZitlBVEQjof59 Feb 10 2019 at 13:28

Вам еще повезло. Год назад я удаленно пытался зарегистрироваться на рейс в одной украинской авиакомпании. Я не знаю какой интеллект у них придумал ставить каптчу на регистрацию на рейс, однако из всего процесса мне запомнилась именно каптча. По всей видимости у гугля иногда что-то с ней залипает пройти ее решительно невозможно. Я проходил каптчу в течении 6 часов. Чего я только не видел и не делал. И велосипеды, и машины, и перекрестки и магазины, гидранты, людей. На каком-то этапе я просто начал кликать рандомные картинки ибо просвета было не видно. После чего, каптча перестала вообще отображатся. Пришлось ехать в гости и проходить каптчу в гостях.

Darth_Biomech Feb 10 2019 at 06:39

Что особенно сильно бесит с гуглокапчей, это то что у меня статический айпишник. Казалось бы, пройди капчу пару раз и докажи свою лояльность. Но она появляется снова… И снова… И снова… А теперь с картинками… Сначала я думал что мне просто «повезло» и попался палёный ИП из подсети которую оптом «забанили в гугле» за ботоводство, но судя по комментариям к этой статье — капчу гугл заставляет вводить если не всех, то многих.

Victor_koly Feb 10 2019 at 11:54

Главное — чтобы не забанили всю подсеть. Совсем прикол. Работал сисадмином в офисе провайдера и в какой-то момент из существенной части офисной сети на поиск в Гугле стало выскакивать «Я не робот». Пробовал искать вирусы — ничего. Пробовали спрашивать у Гугла — ссылаются на «подзрительный трафик». Активность на сайт https://www.google.com снифить весьма сложно, а начальную идею:
1) разделением сети на 3 разных default gateway (себе легко 3 IP выделим под это) для отслеживания «кто останется в бане» — скажем в одну отвести 172.16, а в другую — 172.19;
2) разбан того IP, который был забанен.
Видимо так никто и не сделал.

ED-209 Feb 10 2019 at 11:49

Капчу специально потихонечку усложняют, в надежде, что кто-нибудь и когда-нибудь воскликнет: -Господи, да сделайте уже идентификацию в браузере по лицу через веб-камеру! Сколько можно тыкать светофоры, задолбали…
На этом все и закончится.

dfgwer Feb 10 2019 at 12:04

Будут показывать видео лица.
Капча будет мигать разными цветами и смотреть блики
Будут показывать рендер лица с реалтайме с учетом освещения
Капча будет просить смотреть прямо на камеру и продекламировать стих
Будут показывать рендер лица со всей мимикой и театральным синтезатором речи
…

RuCaptcha Feb 10 2019 at 11:49

Всем привет!
Я из компании, которая занимается распознаванием капчи.
В комментариях много вопросов и споров о том кто те люди, кому нужно распознавание капч.

Если публике интересно, то мы могли бы рассказать о своих клиентах, а то тут то маркетологов обвиняют, то самих владельцев сайтов. А на самом деле всё совсем не так.

vassabi Feb 10 2019 at 13:02

а вы в духе местных традиций — напишите развернутый комментарий в виде отдельной заметки!

RuCaptcha Feb 10 2019 at 21:42

Постараюсь. Но тогда кратко, наверное, да?

Кто использует капча-сервисы?

1. Сервисы для автоматизации получения данных с гос.сайтов
Для России это сервисы по информации об авто и кредитные организации (почти все банки, к примеру, используют капча-сервисы для получения данных по ИНН), например. Для Украины — запись в польское посольство для оформления визы.

2. Перекупщики билетов
В основном американско-канадская тема. Там есть легальный рынок перепродажи билетов. Перекупщики билетов в момент открытия продажи скупают лучшие места за несколько минут. Смешно, что пару лет назад в США вышел закон, запрещающий использование автоматизированных программ для покупки билетов с целью последующей перепродажи и в день вступления в силу данного закона все перекупщики перестали пользоваться капча-сервисами.

3. Любители модной одежды\перекупщики одежды
Эти люди похожи на предыдущую группу.
supremenewyork, adidas и многие другие модные магазины одежды устраивают распродажи лимитированных коллекций и весь товар раскупается за считанные минуты, а потом продаётся по цене в 3-10 раз дороже на ebay.com

4. SEO-специалисты
Те, кто продвигают сайты в интернете, очень любят проверять успешность своей работы, парся выдачу поисковиков. Возможно эту группу можно частично отнести к маркетологам, но я бы не говорил так однозначно.

5. SMM менеджеры
Отложенный постинг, чиста групп от собачек, извещение своих подписчиков личным сообщением — всё это требует ввода капчи.

6. Сборщики криптовалюты
Есть множество сайтов, раздающих мизерные вознаграждения. Самый популярный, пожалуй, это freebitco.in. Общий принцип — за посещение страницы выдаётся маленькое вознаграждение. Владельцы сайтов откручивают рекламу на таких посетителях, платя посетителям 30-70% от того что платят рекламодатели.

7. Накрутчики рейтингов
В WoW ещё играют. Существуют сайты с рейтингами серверов WoW и других игр. Накрутка рейтинга на таких сайтов положительно влияет на онлайн игроков сервера.

7. Спамеры.
Да, они есть. Но после того, как поисковики перестали учитывать спамные ссылки (а иногда и банить сайты за такое), то спамеры почти перестали вести свою деятельность

8. Брутфорсеры.
К сожалению, есть и такие. Их реально очень мало. Не более 0,2%-0,5% от общего количества капч. Мы долго совещались между собой: а не запретить ли гадать через нас капчи от localbitcoins.com и других подобных сайтов. Не запретили, боимся что это породит возникновение конкурентов и отрицательно скажется на отношении пользователей к нам.

9. Слепые
Самая маленькая категория пользователей клиентов, но для нас весьма важная. В последнее время количество слепых, пользующихся интернетом, начало сильно расти. Это результат появления NVDA и разработок голосовых помощников на Iphone\Android. Слепые без проблем могут читать и комментировать Хабр, пользоваться сбербанком-онлайн и т.д. Но как только они встречают капчу, они не могут обойтись без посторонней помощи (если это только не рекапча с голосовой версией, но и там есть свои проблемы). На днях мы даже разработали телеграм-бота, которому можно прислать скриншот экрана, а он возвращает текст с капчи на этом экране t.me/BlindCaptchaBot

Написал без подготовки, возможно какие-то группы забыл.

Victor_koly Feb 11 2019 at 00:12

7. Спамеры.
Да, они есть.

Мне регулярно приходит на эту почту разного жанра спам.

RuCaptcha Feb 11 2019 at 10:54

Mail-спамеры не используют капча-сервисы всё же.

Taciturn Feb 10 2019 at 18:42

Когда уже будут плагины для браузеров для автопрохождения капчи? Можно даже за деньги.

RuCaptcha Feb 10 2019 at 21:53

Есть для ReCaptcah V2:
addons.mozilla.org/ru/firefox/addon/recaptcha-solver

Для простых капч было расширение, но его сложно поддерживать, т.к. нужно каждый сайт добавлять руками и потом следить за изменениями, что требовало ежедневного участия разработчика.

Слепые используют вот это расширение для прохождения капчи в браузере nvda.ru/dopolnenie-captchasolver

Taciturn Feb 10 2019 at 21:57

Спасибо большое!

Iwanowsky Feb 10 2019 at 12:43

Были времена, когда обходились без всяких капч (а еще раньше и все пароли передавались по сети в открытом виде, чем и пользовались первые хакеры). А когда начали появляться первые капчи, то они выводили из себя, т.к. мы тогда с наивностью думали, что зачем почем зря так усложнять регистрацию на сайтах, вход на сайты или скачивание файлов.

Portkir Feb 11 2019 at 21:21

Несколько раз надо было очень быстро решить ряд вопросов. Очков под рукой не было. 10-15 мин. на решение Captca были проведены в шикарном настроении((

geher Feb 15 2019 at 16:41

Капча никогда не сможет точно отделить ботов от людей.
Как пьказывает практика, люди с этой задачей справляюься неважно, а все, что проверяе один бот, другой завсегда подделать сможет.

Если смотреть со стороны пользователя, то капча реально раздражает.
Я почти перестал пользоваться гуглосервисами, поскольку гугл своей капчей просто достал.