Comments 153
схему, в которой используются оптические иллюзии и логические задачки, с которыми тяжело справляться людям. Этот тест называется «тест Тьюринга через ошибку», и единственный способ пройти его – дать неверный ответ.Всегда проще эмулировать человеческие ошибки, чем человеческую правильность.
Гугл тоже эту фишку использует в своей капче при выборе картинок — я заметил, что если быстро все выбираешь то капчу можешь раз 10 проходить, а если делаешь паузы при выборе картинок, то с первого раза проходишь (но когда спешишь, то десятый круг вопринимаешь как издевательство).
Всегда интересна была начинка и реверс-инжиниринг современной рекапчи.
Спасибо за этот лайф-хак, теперь буду чуть медленнее отмечать сфетофоры.
Так что если давать в перемешку задания с иллюзиями и нормальные задания, то это может иметь смысл.
«Заходит англичанин в бар:
а) а он ему как раз
б) а там армяне в нарды играют
в) а в бухгалтерии всё перепутали
и будете чесать затылок.
К нему ещё доступ получить нужно.
Эта рекапча тем и достаёт, что картинки подставляет людям которые не хотят постоянно сдавать анализы гуглу (блокируются их скрипты и часть доменов, а также отсылка "личной" информации).
При этом все страшилки про роботов на некоторых сайтах больше похожи на прикрытие для сбора информации.
Очевидно, что L1, L2 и L3 саппорт, QA, manual & automation, UI/UX, бэкэнд, фронт-энд, DBA, сетевой отдел, on-site, etc. А ещё они все пользуются компьютерами и нужна авторизация, VPN, принтеры, wifi'и, бэкапы и т.д.
Человек 200, и это в условиях острой нехватки сотрудников. А они «скрипт, крипт».
В зависимости от задачи это было 4-5 человек на решение разных задач:
— телефония (2 специалиста);
— интернет (оптика/UTP) и КПД (это именно сетевики с логической стороны, не прокладка оптики по городу);
— частиный случай — инет через ADSL;
— сайты, почта и хостинг.
x2y" + axy' + by = f(x),
с комплексными собственными числами.
P.S. Частный случай моего уравнения (иногда дает решить «подбором») — функция f(x) есть полином степени не выше, чем наибольшее собственное число однородного уравнения. Только если собственные числа таки комплексные, а справа полином — нет простых методов решения.
Кстати, совсем недавно встречал сайт, на котором капча стояла для просмотра материалов.
Кстати, совсем недавно встречал сайт, на котором капча стояла для просмотра материалов.
За Cloudflare?
Думаю, что в скором времени это может решиться обязательной идентификацией интернет пользователя.
А что помешает ботам работать с учётки какого-то постороннего человека?
Если будет доступ со строгой криптографической аутентификацией с помощью ключа, выданного товарищем майором, то вряд ли найдется много желающих предоставить свою учётку для бота (надеюсь понятно, что это сарказм?) ;-)
недавно встречал сайт, на котором капча стояла для просмотра материаловМне сегодня такая площадка в реале встретилась. У вас в городе в феврале обычно работает ярмарка «Мир самоцветов» с горами всяких каменных безделушек и всевозможной бижутерии, как китайской, так и авторской. Народ перед 8 марта там обычно кишит и массово затаривается побрякушками на подарки. И вот вижу я сегодня афишу, решаю зайти, а там… вход сделали платный, и аж два посетителя гуляет. Ну что ж, удачи, ребятушки, не очень-то и хотелось, магазин сувениров в 20 метрах скажет вам спасибо за рекламу… Думаю, с сайтами это так же работает.
Иногда так делают чтобы бомжей и мелких воришек оттолкнуть от идеи посещения, но это для тех случаев в которых действительно есть уверенность что люди придут.
Реальный человек не очень хорошо контролирует моторику, и не может двигать мыш одинаковым образом много раз во время нескольких взаимодействий, даже если будет пытаться сделать это», — говорит Госмахумдер. Робот будет взаимодействовать со страницей, не двигая мышью, или двигая её очень точно, а в действиях человека будет наблюдаться «энтропия», которую сложно подделать
А почему её сложно подделать? По-моему, эта задача на порядок проще, чем распознавание образов на картинках.
К сожалению, маркетолог занимается активным влиянием на рынок, и вот это уже проблема. Именно эти люди заказывают спам-рассылки, заказывают написание кравлеров, различных ботов для всевозможных накруток и т.д.
И именно защита от всего этого — основная задача капчи. А «капча на неудачный пароль» — это какой-то экзотический случай, с которым пользователь будет сталкиваться максимум раз в полгода.
(выберите картинки, на которых что-то двигается)
… Кто-то пробовал тренировать нейронку по признаку оптической иллюзии?
habr.com/ru/post/427947
В последние годы машины научились распознавать объекты и лица на изображениях, а потом создавать похожие изображения. Легко представить, что система машинного зрения должна суметь распознавать иллюзии и создавать свои собственные.
Ну и написали 2 мужика короткую статью. Вышел некий «процесс создания иллюзии»:
Ведь под «роботами» понимаю скрипты для автоматизации определенных действий, например, рассылку спама в комментариях и формах обратной связи. В этом случае капча будет нужна для того, что бы приблизить стоимость выполнения действия скриптом к стоимости выполнения этого же действия человеком (превысить эту величину нельзя, т.к. будет проще нанять людей для распознавания капчи).
Добавляем тоже самое в форумы (для улучшения статистической выборки делаем какую-то общую для вех форумов базу спам-сообщений) — и нет проблем.
Конечно, какие-то отдельные спам-сообщения всё-таки пройдут, но их будет мизер.
Неможерируемый форум? Очень необычная штука в современном мире. Человек вам, как владельцу, может сделать гораздо "хуже" чем бот.
Это будет кардинально правильный сайт, вот только там сообщений будет 0.
А значит не будет и обратной связи от настоящий пользователей.
Поэтому использование капчи, это всегда компромисс между удобством использования и назойливостью от внимания «роботов».
2. Защита от DDOS. Всё, что выдаётся неавторизованному пользователю — кешируется. А всё, что кешировать нельзя и потребуется дёргать приложение(проверка пароля, например) — закрывается капчей. И боты долбят отдающие закешированные данные nginx/varnish/..., а не приложение и базу.
Почему бы не направить усилия на распознавание зловреда вместо того, чтобы мучить людей решением ваших проблем? В статье много написано про выкрутасы с ИИ. Но распознавание спама выглядит куда более простой задачей для ИИ. И обойти защиту значительно сложнее, чем распознавать любую капчу, потому что текст должен быть рекламным. По-моему, это очередной пример, когда настоящую задачу подменяют какой-то технической мурой.
Ведь защита от ботов может потребоваться не в абсолютном смысле (иначе будут спамить не роботы, а реальные люди), а относительная, по сравнению с другими аналогичными ресурсами, например, конкурентов.
Если конкурентов заспамили, что реальных пользователей не видать, у а тебя хоть и бывает проскакивает зловред, но чуть-чуть, тогда твой ресурс выигрывает за счет притока реальных людей.
ботов с той же эффективностью — все тут же на него перейдут.
Тренировать нейронные сети и так далее — явно не задача для владельца какого-нибудь форума или интернет-магазина.
> Задача явно не сложнее создания спама.
То-то в почтовых сервисах Гугла и Яндекса над этим работают целые отделы, и всё равно есть заметный процент промахов и ложных срабатываний. Если вы способны сделать ИИ для качественного отсеивания спама с той же лёгкостью, с какой любой минимально знакомый с программированием человек может сделать бота для его рассылки — вы сказочно обогатитесь.
Для владельцев сайтов капча — просто подключаемый сервис.
Мы же обсуждаем разработку капчи, а не людей, которые подключают сторонний сервис.
То-то в почтовых сервисах Гугла и Яндекса над этим работают целые отделы
Всё-таки для почты эта задача мне кажется сложнее, чем для сайтов. Да и справляются фильтры сегодня весьма хорошо. И с капчой есть «заметный процент промахов и ложных срабатываний». Если точнее — капча справляется гораздо хуже.
Учитывая отношение современной капчи к пользователю, особенно когда что-то надо вотпрямщас — её использование в явном виде воспринимается как личное оскорбление.
И боты долбят отдающие закешированные данные nginx/varnish/..., а не приложение и базу.
А пользователи уходят куда-нибудь в другое место…
Во-вторых, увидев timeout или 503/504, 100% пользователей уходят куда-нибудь в другое место. Разумеется, включать капчу надо только на время DDOS.
Роботам можно подложить «фальшивый сайт». То есть спамерский скрипт вывалит свой спам на площадку для роботов, скрипт, который контролирует работу роботов проверит наличие комментариев на «роботской» копии ресурса, заказик спама заплатит за размещение спама, а вот на «человеческой» копии ресурса спам не появится. То есть стоимость $1, эффекта — 0, и соотношение цена/качество = $1/0 = ∞
Кажется, боты стали умнее людей.
Чтобы я смог с вами поговорить ответьте, написав "nospam" (с кавычками).
, ни один робот не прошёл, из людей никто не жаловался.
И лично меня не покидает устойчивое ощущение, что этот робот в свое время был настроен человеком, т.к. его действия, по сути, представляют собой мини-программу, адаптированную конкретно под мои авторизационные страницы/формы.
А в таком случае ваш метод вряд ли поможет.
Уж на что я считал себя знатоком нашего кино, все фразы наизусть знаю, а прокололся в этом тесте. И не раз.
dubikvit.livejournal.com/735770.html
Также проблема анонимности. Если я хочу зайти на сайт анонимно, я не буду пользоваться никакой системой, и рейтинга у меня никакого не будет, иначе моя личность сразу будет раскрыта. В итоге у меня нулевой рейтинг.
Пользователь должен выбрать из пяти рисунков реальных животных те из которых составлена его химера.
Пока вижу единственное слабое место — если исходных вариантов мало — компьютер может не решать загадку честно, а тупо запомнить все комбинации.
такие капчи с культурной привязкой нацелены не только на роботов, но и на людей из других стран, решающих капчи за копейки.
Все почему-то не заметили эту фразу, а это имхо в статье самое главное. Капчи уже давно не пытаются различить ботов и людей. Они пытаются различить людей первого сорта и людей второго сорта. И это реально страшно.
Мне re-captcha ни разу не предлагала выбирать на каких-то картинках какие-то витрины, поэтому я никогда не понимал мемы на эту тему. Теперь хоть яснее стало :)
Давайте, может, будем разделять допустимые и недопустимые действия, независимо от того, человек их делает или робот?
Если робот зашёл на форум и в теме «Анекдоты у костра» раз в день постит случайный анекдот, а в теме «Котики» — случайное фото кота, то чего нам ему мешать?
А если человек пишет в этих же темах «курсовые для студентов, быстро и качественно, размещайте заказ на сайте» — он требует очереди из плюсомёта
Плюсомет оружие во первых дорогое (человеческий ресурс), а во вторых действует уже по факту поста, когда аудитория его уже прочитала. Использование же премодерации снижает конверсию.
Реклама может быть на человеческом форуме, но лишь как средство обеспечения финансирования непосредственно цели работы форума, а не заменять собой эту цель.
И вот reCapcha, на мой взгляд, пытается убедить вас что linux + ff + блокеры скриптов гугла и рекламы — только мешают вам жить, даже на странице поиска гугл.
Гифки нужно в капче проигрывать, где происходит какоето действие с очевидным эмоциональным окрасом, например «убийство» или «грусть» или «любовь», что-нибуть явное в плане эмоций для человека и совсем не ясное для машинного алгоритма.
Также картинки появляются не сразу, а приходится ждать по 10 секунд, когда соизволит появиться картинка. А ведь за одно изображение таких появлений будет даже не одно, а несколько штук. А самих изображений тоже несколько.
Самое интересное, что поганая капчта иногда показывается просто при входе на какой-то сайт. Вас что, ддосят именно сейчас что ли? Никогда не поверю. Отдать страницу стоит 0.0000001 коп. Нафига автор тогда создавал сайт?
1) разделением сети на 3 разных default gateway (себе легко 3 IP выделим под это) для отслеживания «кто останется в бане» — скажем в одну отвести 172.16, а в другую — 172.19;
2) разбан того IP, который был забанен.
Видимо так никто и не сделал.
На этом все и закончится.
Я из компании, которая занимается распознаванием капчи.
В комментариях много вопросов и споров о том кто те люди, кому нужно распознавание капч.
Если публике интересно, то мы могли бы рассказать о своих клиентах, а то тут то маркетологов обвиняют, то самих владельцев сайтов. А на самом деле всё совсем не так.
Кто использует капча-сервисы?
1. Сервисы для автоматизации получения данных с гос.сайтов
Для России это сервисы по информации об авто и кредитные организации (почти все банки, к примеру, используют капча-сервисы для получения данных по ИНН), например. Для Украины — запись в польское посольство для оформления визы.
2. Перекупщики билетов
В основном американско-канадская тема. Там есть легальный рынок перепродажи билетов. Перекупщики билетов в момент открытия продажи скупают лучшие места за несколько минут. Смешно, что пару лет назад в США вышел закон, запрещающий использование автоматизированных программ для покупки билетов с целью последующей перепродажи и в день вступления в силу данного закона все перекупщики перестали пользоваться капча-сервисами.
3. Любители модной одежды\перекупщики одежды
Эти люди похожи на предыдущую группу.
supremenewyork, adidas и многие другие модные магазины одежды устраивают распродажи лимитированных коллекций и весь товар раскупается за считанные минуты, а потом продаётся по цене в 3-10 раз дороже на ebay.com
4. SEO-специалисты
Те, кто продвигают сайты в интернете, очень любят проверять успешность своей работы, парся выдачу поисковиков. Возможно эту группу можно частично отнести к маркетологам, но я бы не говорил так однозначно.
5. SMM менеджеры
Отложенный постинг, чиста групп от собачек, извещение своих подписчиков личным сообщением — всё это требует ввода капчи.
6. Сборщики криптовалюты
Есть множество сайтов, раздающих мизерные вознаграждения. Самый популярный, пожалуй, это freebitco.in. Общий принцип — за посещение страницы выдаётся маленькое вознаграждение. Владельцы сайтов откручивают рекламу на таких посетителях, платя посетителям 30-70% от того что платят рекламодатели.
7. Накрутчики рейтингов
В WoW ещё играют. Существуют сайты с рейтингами серверов WoW и других игр. Накрутка рейтинга на таких сайтов положительно влияет на онлайн игроков сервера.
7. Спамеры.
Да, они есть. Но после того, как поисковики перестали учитывать спамные ссылки (а иногда и банить сайты за такое), то спамеры почти перестали вести свою деятельность
8. Брутфорсеры.
К сожалению, есть и такие. Их реально очень мало. Не более 0,2%-0,5% от общего количества капч. Мы долго совещались между собой: а не запретить ли гадать через нас капчи от localbitcoins.com и других подобных сайтов. Не запретили, боимся что это породит возникновение конкурентов и отрицательно скажется на отношении пользователей к нам.
9. Слепые
Самая маленькая категория пользователей клиентов, но для нас весьма важная. В последнее время количество слепых, пользующихся интернетом, начало сильно расти. Это результат появления NVDA и разработок голосовых помощников на Iphone\Android. Слепые без проблем могут читать и комментировать Хабр, пользоваться сбербанком-онлайн и т.д. Но как только они встречают капчу, они не могут обойтись без посторонней помощи (если это только не рекапча с голосовой версией, но и там есть свои проблемы). На днях мы даже разработали телеграм-бота, которому можно прислать скриншот экрана, а он возвращает текст с капчи на этом экране t.me/BlindCaptchaBot
Написал без подготовки, возможно какие-то группы забыл.
addons.mozilla.org/ru/firefox/addon/recaptcha-solver
Для простых капч было расширение, но его сложно поддерживать, т.к. нужно каждый сайт добавлять руками и потом следить за изменениями, что требовало ежедневного участия разработчика.
Слепые используют вот это расширение для прохождения капчи в браузере nvda.ru/dopolnenie-captchasolver
Капча никогда не сможет точно отделить ботов от людей.
Как пьказывает практика, люди с этой задачей справляюься неважно, а все, что проверяе один бот, другой завсегда подделать сможет.
Если смотреть со стороны пользователя, то капча реально раздражает.
Я почти перестал пользоваться гуглосервисами, поскольку гугл своей капчей просто достал.
Почему капчи стали такими сложными