Как стать автором
Обновить

Ты не видишь капчу, а она есть: как мы разрабатывали сервис Yandex SmartCaptcha для людей и бизнеса

Время на прочтение8 мин
Количество просмотров23K
Всего голосов 59: ↑48 и ↓11+37
Комментарии100

Комментарии 100

Чтобы оказаться подозрительным хватает уже просто перебора страниц результата поиска - раздражает жутко!!! А без перебора иногда никак, особенно если ищешь по новизне: имеющийся фильтр по времени работает довольно криво пропуская кучу старого, а выборочные сортровки результатов яндекс уже давно убрал (очень удобная вещь была).

Причина думаю не в том что пользуется мало людей, а в том что поисковику выгодно длительное нахождение людей на страницах поиска.
Больше результатов перебирать - больше рекламы и "продвигаемых результатов" посмотрит.

Если бы он они еще давали много перебирать - 10..20 пролистываний страниц результатов и ты кажешься яндексу подозрительным.

Это еще и неплохо, меня на проверку часто и без листания страниц выдачи вообще отправляют. Если быстро что-то ищешь, с небольшими промежутками времени сделал 2-3 запроса (обычно уточнения/переформулировки исходного или дополнительного связанного с ним). На каждый запрос прокликал 3-5 ссылок из результатов (причем обычно вообще дальше 1й страницы не уходя). Все, ты наверно робот, решай КАПЧУ!


Причем, блин, мне периодически от Яндекса еще "двойная" КАПЧА достается, о которой в статье вообще не слова.
Это когда тебя при использовании поиска Яндекса заподозрили роботом, заставили решать КАПЧУ, и ты ее правильно решил с первого раза, НО вместо продолжения работы Яндекс такой: что-то ты мне все-равно подозрительным кажешься! А ну-ка решай второй раз другую теперь иначе искать ничего не дам!


P.S.
Если с учетом нулевой стадии (где текст искаженный набирать не надо, а только поставить галку "я не робот"), то КАПЧА получается тройная: 1 — ставим "я не роборт", 2 — нам не верят, вводим текст КАПЧИ, 3 — нам все-равно не верят и заставляют пройти капчу (другой ее подвариант) еще раз.

Какой замечательный кактус. А зачем его есть-то?

Добрый день!

Нам очень жаль, что вы столкнулись с такими проблемами.
На подозрительные запросы мы действительно можем показать несколько челенджей в виде капчи подряд.
Для того чтобы мы могли разобраться конкретно с вашей ситуацией, напишите в форму поддержки https://yandex.ru/support/smart-captcha/index.html#help
С указанием вашего аккаунта и того, что вы с Хабра.

А 403 залогиненному и доступ после чистки кук после того, как пользовался рабочим местом с выходом в инет в том числе и из датацентров?

На мой взгляд - это больше издевательство, чем защита.

403 — это уже точно не капча, это другие инструменты борьбы с роботами.

Ребята, это не единичная проблема, а реально массовая, и количество плюсов к исходному комментарию - тому подтверждение. У меня, например, аналогично, из-за этого даже поставил гугл поисковиком по умолчанию. Подорожник в виде "сообщите название аккаунта, мы вам персонально всё отключим" - не поможет.

двойная капча - это ещё по божески, вот бесконечные повторы капчи от cloudflare - это средство пыток

Хуже только hCaptcha с их кончеными требованиями...

слишком быстро листаешь, рекламу не досмотрел)))

В моём случае достаточно 5 страниц. На 5-й гарантированно появляется капча, иногда даже раньше.

Осталось сделать капчу с просмотром рекламы.

НЕ подсказывай1111

На рутубе уже было

Думал про рутуб, но там это скорее элемент рекламы, а не капча.
Но да, наиболее близкое.

p.s.
Было? Вроде же всё ещё есть.

Или если решаешь в процессе поиска переформулировать запрос. Например вместо "$названиедетали чертёж" пробуешь искать по запросу "$названиедетали размер". Более того, с телефона капча иногда ни в какую не принимается!

Важно разделять алгоритм для принятия решения о показе капчи и саму капчу. Алгоритм может быть простым, например, на любой форме смены пароля мы будем просить пройти капчу. Или же может быть сложным для поиска трафика от роботов, например, парсеров.

И каждый владелец сервиса может настраивать механики принятия решения. Но в любом случае спасибо за обратную связь, самые наши главные метрики про людей и только после контроля уровня дискомфорта наших пользователей мы делаем какие-то изменения для борьбы с роботами.

Не совсем так. Для того чтобы оказаться подозрительным, учитывается много факторов. Кроме того, владелец сайта сам определяет, когда появляется капча. Это два разных механизма: 1) есть алгоритм, который принимает решение — показать челлендж в виде капчи или нет. Алгоритм может быть простой, типа «всегда показывать челлендж при заполнении формы» 2) капча — один из возможных челленджей.

Тут важно отметить, что в данном случае не идет речь о капче в контексте поискового портала Яндекса. Речь идет о капче как инструменте. И если для вас важно не снижать воронку, можно включить простую капчу.

Да, меня буквально з***** это их капча каждые 2 страницы поиска, и самое ***** что не важно быстро или медленно листаешь, ровно каждые 2-3 нужно вводить капчу. У меня просто нет слов, они делают всё, чтобы пользователи не пользовались их поисковиком.

При чём это началось не совсем так уж давно, наверно 3 месяца назад.

Такое у них уже давно было, еще пару лет назад. Но потом како-то попустило, прекратился этот бред, причем без каких либо действий/изменений с моей стороны и даже без жалоб в поддержку.


А последние пару месяцев действительно снова обострение старой болезни началось.
Рецидив так сказать...

Самый позорный кейс с которым постоянно сталкиваюсь, это капча на яндекс маркете при переходе на товар из стороних поисковиков.

Разумеется не буду тратить время на её разгадывание, а пойду к конкурентам - озон, wb и т.д.

Та же проблема. Когда я все же изредка даю возможность тому, что осталось от поиска яндекса доказать мне, что он еще что-то может, то мало того что первую страницу нужно сразу игнорировать из-за массовой саморекламы яндексом своих вертикалей, так и на второй странице меня ждет не выдача, а капча.

Яндекс, я не Индус, вы мне по 0000.1 доллара за решение капчи не платите. Я просто закрываю и отправляюсь с вашего портала в нормальный поисковик.

Если бы ещё капча не возбуждалась на ipv6 от hurricane tunnel broker, то было б неплохо, но поддержка несколько раз дала понять что делать ничего не будут, чем поддакивают пользоваться сервисы Я только если совсем никак

А всякие туннели/впны (читай – анонимайзеры) в любом случае будут делать профиль не похожим на общечеловеческий.

я часто вообще захожу в поиск в режиме "инкогнито", так кроме капчи ещё разражает куча переходов на sso.yandex и подобное… и это всего то при открытии ya.ru

Тоже бесит. Вот бы была лёгкая версия яндекса, где только поисковая строка и всё... Жаль, что до такого никто не додумался.

Давно додумалась, была такая — располагалась по адресу ya.ru в течении многих лет.
Но после того как основной домен yandex.ru отжали продали (вместе с Дзеном и новостным агрегатором) в прошлом году Яндекс переехал на ya.ru как основной. А супер-минималистичная версия Яндекса, которая до этого момента на этом домене висела в процессе похоже потерялась.


P.S.
Возможно не потерялась, а в свою очередь тоже просто куда-то переехала? Но тогда я не знаю куда ее задвинули...

да просто тоже удалили, это же было удобно, а так они точно не оставят

Ну здравствуйте от человека, который по Вашей милости регулярно OCR'ом работает :) Пара поисков товара на Я.Маркете - и здравствуй капча. Да, я захожу из-за границы. Но я захожу под своим аккаунтом, я с этим аккаунтом из этой страны (и в основном с одного и того же статического IP) захожу уже полгода. Регулярно делаю реальные покупки. Этого никак недостаточно, чтобы меня из роботов в люди зачислить?..

Здравствуйте!

Сожалеем, что вы столкнулись с такими проблемами.
Информация про то, из какой страны заходит пользователь — это один из факторов, которые использует наша ML-модель. Это далеко не единственный фактор, который мы используем для принятия решения.

Чтобы мы могли разобраться конкретно с вашей ситуацией, напишите нам в форму поддержки https://yandex.ru/support/smart-captcha/index.html#help (с указанием вашего ника и того, что вы с Хабра).

Еще некоторые около/государственные сайты не дают заходить из других стран(в частности из Казахстана) к ним. "Очень удобно". При чем не то что капчу, сразу доступ запрещают.

С государственными сайтами это судя по всему норма. На американские госсайты вообще невозможно зайти не с американского айпи

А как ими пользуются американцы из других стран?

Думаю впн с американским айпи, конечно

Или, менее вероятно, какой-то внутренний инструмент для таких ситуаций, и о нем малоизвестно по причине редкости ситуации

Что-то не замечал такого. И на сайт Белого дома/конгресса, мин. обороны и федрезерва (ФРС), американских судов, прокуратуры, SEC(комиссия по ценным бумагам), без ВПН даже с российского ip и раньше заходил и сейчас захожу без проблем. Больше как-то в голову ничего не приходит, что еще можно проверить и что может быть хотя бы потенциально интересно живущим в других странах.


С гос. сайтами США или ЕС вообще ни разу с таким не сталкивался. Вот с частными западными компаниями иногда встречаюсь с "бойкотом", когда не хотят для российских ip открываться и приходится включать ВПН. Имеется ввиду НЕ из списка заблокированных изнутри Роскомпозором на уровне российских провайдеров интернета, а заблокировавших запросы с российских ip самостоятельно на стороне своих серверов. Но это именно на российские ip (может еще Иранские и еще нескольких стран исключений) блокировки, а не "все кроме своих". Т.е. это "черные списки" (кого не принимают), а не белый (шлем лесом всех, кроме "своих").


И с российскими гос. сайтами, когда забыл выключить ВПН и тебя не пускают из-за того, что у тебя не российский ip. Тут именно "белый список" (не пустим никого кроме своих).

Не только государственные и не только в России, увы. Интернет на глазах распадается на отдельные сегменты... У меня свой VPN с маршрутизацией (по GeoIP, спискам РКН и/или вручную настроенным перечням сайтов / AS) между тремя странами, которые мне часто нужны (ну и такая же маршрутизация на домашних роутерах), позволяет не переключаться между VPN / без VPN / другим VPN постоянно... Но это точно не к Яндексу и не в эту тему :)

Тестируйте нашу капчу

Спасибо, натестировались. Как справедливо уже заметили, перелистывание нескольких страниц результатов поиска практически гарантированно приводит к появлению запроса на капчу. И они что-то такое в свою капчу подмешивают, что прокси-сервер считает это злостной рекламой и вырезает, из-за чего капчу пройти невозможно. А поскольку сотрудников через эти прокси выходит много, подозрения яндексовского "антифрода" только крепнут!


Уж как мы с этим только не боролись... и в поддержку Яндекса писали, и настройки прокси по-всякому крутили, всё бесполезно... последнее средство -- официальное письмо на бланке компании за подписью Генерального директора о том, что в офисах компании используются такие-то статические адреса прокси-серверов, принадлежащие нашей автономной системе, пожалуйста, сделайте для них исключения в ваших фантастических алгоритмах. И вы знаете, помогло! На полгода примерно, потом капча стала мучить пользователей снова.

Поэтому наши хелпдески всем пользователям говорят -- используйте какой хотите поиск, но только не Яндекс.

Если при перелистывании вылазит что-то про робота, перехожу в другой поисковик, галочку не ставлю принципиально.

  1. Чтобы оказаться подозрительным достаточно просто быстро открывать страницы, причём, похоже, любые. Читаю я быстро, оценить, что на странице ничего нужного могу за секунду, соответственно — капча показывается примерно каждый раз, как захожу на любой сервис яндекса.

  2. Чтобы получить постоянный 403 на яндекс.маркет — достаточно случайно зайти туда с рабочего впн до одного из дц, после чего капчу уже не предлагают, а сразу отдают 403 в данный браузер. ДЦ - в России, если что.

  3. Данная мера (403) нихрена не помогает от всяких скраперов и т.п., так как 403 отдаётся только браузеру с соответствующей кукой, т.е. скрипт вполне себе без авторизаций и кук будет получать нужное.

  4. техподдержка - набрана с вокзалов, причём по составу не проходили, ибо не предлагать почистить куки - это уровень первого вагона.

Вобщем, мой вывод: конкретно это — защита от честных людей.

0. Не совсем так. Для того чтобы антиробот определил подозрительное действия, берется множество факторов и одной скорости работы недостаточно. В случае SmartCaptcha клиент сам решает, когда показывать Капчу, а когда нет.

1. 403 — это уже точно не капча, это другие инструменты борьбы с роботами

2. Тут уже на стороне тех сервисов, которые применяют такую меру

3. Наши коллеги из ТП активно развиваются и вкладываются в развитие своих сотрудников. Как раз недавно была писали об этом

Раз вы используете ml модели, возможно они не на то натренировались? Вы же видите сколько отзывов отрицательных. Я сам кучу раз сталкивался с галками я не робот просто браузя по поисковой выдаче яндекса.

А можно уточнить, насколько равномерные веса в этом "множестве факторов"? А то может у вас один фактор имеет вес 0,999, и ещё тысяча факторов с весом каждого 0,000001. Теоретически получается три миллиона долларов больше тысячи факторов, а фактически - две проститутки и старый педик всего один.

0-2. Поскольку я с таким сталкивался ТОЛЬКО на сервисах Яндекса, вывод: Яндексу не нужны более-менее продвинутые пользователи.

3. может быть и вкладываются, но это не слишком помогает в моём случае: ни первая линия поддержки, ни то, куда был эскалирован вопрос до чистки кук додумались только потребовать не использовать удобный браузер, в котором проблемы ТОЛЬКО с сервисами яндекса - это несколько не то, что ожидается от поддержки.

Для себя пока сделал следующие выводы:

  • как можно меньше использовать сервисы яндекса (единственный беспроблемный - почта и то, потому что писем там одно-два в неделю), проблем с ними больше, чем пользы.

  • по-умолчанию считать, что техподдержка яндекса не решит проблему и дешевле забить на неотвечающий сервис, чем разбираться, что там и как.

Несколько раз уже не мог пройти эту капчу. Заклинивает её в чём-то. После 3-4 попыток плюю и иду искать в duckduckgo.

Предполагаю паршиво работает с мобильным Firefox.

SmartCaptcha, о которой я рассказывал в статье, встраивается разработчиками сервисов, и они выбирают сложность заданий исходя из своих потребностей и того, насколько критической является та или иная часть сервиса.

Нам бы очень хотлось разобраться в вашей ситуации. Если не сложно, оставьте, пожалуйста, больше информации о том, что происходит, в форме с указанием вашего ника и того, что вы с Хабра.

Меня сильно раздражает ваша капча, перестал пользоваться вашим подсайтом недвижимости.

Вы попробуйте вообще сами попользоваться своими сервисами.

Как настраивать капчу, решают уже владельцы ресурса. Вы можете сами настроить, как капча будет работать при наличии подозрения на автоматизацию.

И владельцы поисковика-Яндекса настроили так, что иногда им просто невозможно пользоваться.

Как настраивать капчу, решают уже владельцы ресурса.

Формально вы правы, а по сути - издевательство.

Вы отказываетесь от ответственности за ложные срабатывания.

Это просто бесячья фиговина. Никому не порекомендую ставить на свой сайт, только клиентов потеряете. Легче самому капчу написать. К тому же скорее всего еще и шпионит за клиентами (есть четкая корреляция при входе в сбербанк онлайн в браузере, капча перестает возбуждаться, это по моим личным наблюдениям) Крайне не рекомендую для интернет-магазинов.

1) Мы только за то, чтобы появились еще алгоритмы по защите от автоматизации. Чем больше капчи, тем лучше. Но поверьте, это не простая задача!

2) Наша капча не используется в Сбербанк Онлайн, поэтому корреляция здесь случайная. В любом случае, капча не собирает никаких данных о пользователях, это исключено.

Но постойте, вы же сами там упоминали фингерпринт пользователя, а теперь отнекиваетесь.

Когда началась разработка сервиса Yandex SmartCaptcha, мы постарались
переиспользовать код, который уже был написан. Например, хук useCaptchaState,
помимо логики самого виджета, контролировал загрузку ресурсов,
сбор
фингерпринтов пользователя
и использовался в Antirobot. Это привело нас к
первой версии архитектуры.

Зачем держать нас за глупых людей? Тут все читать умеют. Яндекс не собирает информацию о пользователях - очень смешная шутка наверное.

Тестируйте нашу капчу

боже упаси сотрудничать с компанией у которой "семь пятниц на неделе"

ps: о чем можно говорить, когда яндекс вебмастер рассказываем мне что не видит яндекс dns

На днях проходил вашу капчу минут десять. Какими словами были охарактеризованы разработчики яндекса – догадайтесь сами. Если почувствовали над офисом воронку инферно – это было оно.

А всего-то надо принимать результат ввода капчи не только как одно слово, но и как несколько слов, разделённых пробелами. Не «успервалпрочему», а «успевал прочему».

Погодите, я всегда вводил через пробел, а что, надо слитно?

Одна из худших капч. У вас KPI не отказоустойчивость, как должно быть, а видимо ущерб бренду.

Капча должна защищать сервисы от нагрузок ботов, а не заставлять пользователя в обмен на операцию, занимающую у вас 5 мс тратить 10 минут времени или уходить к конкурентам.

Давно не пользуюсь многими сервиса яндекса только из-за капчи на поиске, сама мысль, что придётся тратить минуту, не справляться с капчей и потом уходить в утку натренировала мозг не пытаться открывать сервисы яндекса даже без впн

KPI как раз определяет владелец сервиса. Если для него остановить роботов критичней, чем конверсия, то есть возможность так и сделать. Наоборот тоже.

Просто в данном случае чересчур параноидальные настройки на конкретном сервисе портят репутацию самому инструменту. Причём учитывая, что Яндексу принадлежат и сам инструмент, и сервис, который этому инструменту портит репутацию... что-то пошло не так :(

Мне ещё интересен один простой вопрос.
Если сама компания разработчик капчи, использующая её в одном из своих сервисов, не может настроить оную так что бы не вызывать подгорание филея у пользователей...

А сторонние сервисы точно справятся?

Повторюсь за другими: каждые три запроса в поисковике - капча. Это массовая и бескомпромиссная экспансия Толоки что-ли? Кстати, в саппорте лишь пожали руками: "мы научим модель не превращать поиск в толоку, когда-нибудь, может быть, извините". Причем первое время капча всплывала только из под рабочего впна. Через неделю на мой ноутбук, видимо, уже поставили "черную метку", ибо сеть уже перестала влиять

Бгг, а вы попробуйте в Толоке что-нибудь поделать неторопливо. Я проводил эксперименты: пока задачи выполняю я сам (с хорошим интернетом, очень скоростным чтением и т.д.) - задачи валятся пачками. Посадил тестя, который на пенсии, и делает всё весьма неторопливо - через десяток заданий он получил "шадоу бан" (то есть, Толока вроде как и работает, но задач для него нет). Повторил эксперимент ещё с парой людей - аналогично

Разработчикам Яндекса просто в голову не приходит, что есть реальные люди, которых будет устраивать доход в 5-10 тысяч в месяц за многочасовое кликание мышкой в интернете, и они этих людей сразу записывают в боты. Вероятно с формулировкой "неужели вообще существуют люди, которые работать меньше, чем за триста тысяч в месяц?"

Интересная статья, спасибо! Мне нравятся тексты на капче Яндекса. Даже более того: один из них вдохновил меня сделать канал в телеге. Я искала что-то в Вордстате, вылезла капча с текстом «Крыша переживай». Ух, какаю бурю эмоций во мне вызвала эта подпись. Такую, что я создала тг-канал и назвала «Крыша переживай». А обложкой для него стал скриншот капчи. Так что спасибо вам за сервис :)

Ужастная капча. Пару раз сталкивался (редко пользуюсь вашими продуктами) — и честно говоря потратил на её ввод непозволительно долгое время.


И да как человек когда то разрабатывающий программы по взлому капч могу сказать, что ваша капча предназначена только для отпугивания людей, с чем она прекрасно справляется, но совершенно не способна отпугнуть бота специально сделанного под вашу капчу.


Поясню свою мысль — при взломе капч главное выделить отдельные символы, у вас это делается с лёгкостью, ничего не сделано что бы максимально склеить символы. Опять же все ваши искривления — это только сломать человеку мозг, а программа анализирует алгоритмы искривления, например если есть какие то волнистые линии или другие пиксели, и делается карта градиента искривления. А потом просто восстановление изначальной картинке по карте.


Например в вашей капче, так на вскидку ищем в символе прямую линию, смотрим наклон, отличающийся от 90% и строим карту градиента. Разумеется под каждый символ можно сделать свои индивидуальные настройки. Сколько там символов? Русский алфавит + цифры? Опять же у вас волна, поэтому искривление соседних букв должно быть минимальным. отсюда можно стразу выкидывать неправильно определённые искривления промежуточных букв. Короче куча вариантов для алгоритма.
Хотя я перемудрил. Делаем максимальное мыло. Получаем тупо искривлённую линию. А дальше просто выпрямляем эту линию. Сдвигаем пиксели всей картинки. Ну и получаем чистые нормальные символы. Далее уже нарезаем.


А далее отдельные нарезанные картинки подаются на нейросеть. Ваши буквы даже простейший перцептрон будет правильно анализировать символы на лету.


Опять же фон — вы человеку хотите трудности или роботу? Ваш фон удаляется с картинки самым простейшим алгоритмом — буквы имеют чёрный цвет. Выкидываем всё что не чёрное. Это к капче из статьи. Если у вас и цветные есть (не знаю) тоже выкидываем всё что не цвет символов.


Повторяюсь — главное в капче нарезка символов и преобработка картинки (исправление искажений и другие операции из разряда фотошопа). А сама нейросеть уже не главное — справится абсолютна любая, даже самая кривая.


Upd. Ещё добавлю — чем больше всяких цветовых искажений, тем труднее для человека и проще для алгоритма. За каждый цвет можно зацепится и использовать его в алгоритме.
Например буквы одним цветом а искажения куча других — тогда просто оставляем только цвет букв, или например разноцветное месиво можно все цвета уровнять и получить почти идеальные символы. Поэтому чем меньше за что зацепится, и найти взаимосвязи тем сложнее автомату. ЧБ капчи самые идеальные. А если ещё и на эффекте шума..., но тут тоже куча вариантов. Шум можно замылить и опять же получить чёткие символы.

Перестал пользоваться Кинопоиском и Яндекс Маркетом (последнее чем ещё пользовался) именно из-за капчи.

Сейчас, кстати, стало получше, а раньше любая попытка захода на сайт через зарубежный VPN - гарантия получения капчи чуть не после каждой страницы.

Так что спасибо, но в интернете к счастью есть альтернативы.

Зайти в инкогнито, вылезет капча! Перезайти в другой профиль, вылезет капча. Зайти в вордстат и что-то проверить тоже капча, даже без инкогнито. Вообще любой сервис в яндексе через инкогнито, привет капча!!! Бесит ужасно, и ничего тут не исправлено, как вылезала по 100 раз при каждом запросе в вордстате, так и вылезает! Вход через vpn снова капча...

Теперь ещё и когда поисковиком пользуешься, вечно вылезает этот надоедливый баннер, установите яндекс браузер...

Зачем???!!!

Сначала "Сделайте Яндекс поисковиком по умолчанию" ок, сделал, а теперь баннер с браузером мельтешит, месяц потерпел и вернул гугл

Интересно, как будут выкручиваться, когда нейросети начнут решать каптчу лучше людей. Или мы уже на этом этапе, просто не всем пока доступны такие инструменты?

К тому времени вход в интернет будет по есиа

Мы уже точно на этом этапе, об этом косвенно упомянуто в статье, в комментариях выше тоже уже написали, что исправить искривление и распознать не такая уж и проблема. Инструменты такие в open-sourse пространстве есть, если захотеть – найти не проблема.

Я честно пытался решить капчу яндекса и писал им фидбеки пару лет назад, когда перешел на постоянное использование зарубежными VPS.
Меня дико бесил мелкий шрифт (нечитабельный для пользователя с плохим зрением как я), а также замысловатая геометрия начертания слов, после которой разобрать что либо не представлялось возможным ни роботу ни человеку со здоровыми глазами!
Капча вылазит у меня стабильно и постоянно на поиске яндекса при обычном пролистывании результатов. Как писали пользователи выше достаточно быстро кликать страницы и уже на 3/5 ой странице вылезет эта дрянь.
Порой возникает необходимость найти что-то уникальное, что гугл фильтрует, а утка не ищет вообще, затем и приходится обращаться к яндекс-поиску иначе он давно бы отправился на помойку вслед за своей почтой (которую я тоже попробовал и дропнул).

p.s. Обращание к разработчикам яндекса: начните сами пользоваться своими сервисами и обязательно через VPN.
Непередаваемый user expiriens гарантирован.
p.p.s. Думать о людях, живых людях, а не роботах у вас по прежнему получается плохо, нужны испытания на "кошках" и программистах, разрабатывающих это дерьмо. (уж простите не сдержался!)

Почему у меня требуют капчу по нсколько раз при заходе на ya.ru?

Меня всегда просит распознать самый сложный вариант

О, вот у кого можно спросить. Мой типичный сценарий: пользуюсь кучей ваших сервисов, залогинен. Но порой внезапно ваша капча начинает защищать сервис от моего использования. Это что, правда выглядит как реальный сценарий, при котором просто необходимо мне что-то ограничить? Смотрю у многих так: речь не идёт о каком-то бешеном парсинге, люди просто пользуются сервисом и их принимают за роботов.

Ладно когда анонимный или новый пользователь. Но когда ваш, которого вы со всех сторон изучили - прям реально надо ему капчу совать? А то что? Что может случиться?Три-четыре клика подряд у вас серверы перегрузят?

Ещё один комментарий в копилку недовольства капчой.

Яндекс, вы своими руками отталкиваете от себя пользователей, которые сохранили лояльность к вам после переезда за границу.

Не пользуюсь ни впн, ни прокси, просто уехал, но привык пользоваться поиском и другими сервисами Яндекса. Пришлось менять привычки, поскольку сил пользоваться Яндексом уже нет - капча выбешивает. Полбеды когда она регулярно выскакивает - можно выругаться и ввести, но когда она не работает, то есть когда десятка раз подряд не хватает чтобы определить во мне человека - ничего не остаётся кроме как нажать на крестик и пойти в другое место.

Максимально недружелюбная капча. Иногда нравилось использовать яндекс переводчик, но впихнуть капчу на очередной ввод или перезагрузку страницы и ко всему этому капча на русском языке которая не прощает ошибок… Это просто убого, как этим можно пользоваться? Чистый ip, без vpn. Возможно в некоторых случаях проблема в ipv6, но почему это должно волновать пользователя?

Неправда, максимально недружелюбная капча — это в Epic Games Store, та где надо крутить стул.

В режиме инкогнито ловлю капчу уже на 3 странице поиска. Что с телефона, что с компьютера. Даже гугл не настолько ретив, поэтому извини яндекс, но твой поиск для меня закрыт.

Пользуюсь ya.ru/archive. Капча появляется каждые 5 минут. Если сказать политкорректно, то это меня сильно затрахало.

Не зря статью писали. Благодаря ей от комментаторов узнали сколько у вас проблем с вашей капчей)

Вот у меня нет кириллицы на клавиатуре. Яндекс удобен тем что автоматом переводит посиковые запросы из транслита - но капча - только по русски. И часто.

При попытке ввести более одного запроса в "Яндекс Картинках" или просто при переходе в них из выдачи поисковика зачастую получаю нерешаемую циклическую капчу. Но это еще полбеды. Беда в том, что иногда после ввода капчи выдача кардинально меняется, порой на совершенно нерелевантную.

И как уже выше многие писали - все чаще возникает желание закрыть вкладку и обратиться к Google.

Сегодня утром словил там капчу на первом же запросе.

А вообще есть капчи которые современные модели не могут пройти ? Ну я вот с трудом себе представляю, чтобы CLIP не мог найти автобус на картинке или текст распознать такой, который человек может распознать.

Теперь знаю кого "благодарить" когда блокируется на сутки отправка почты ;)

А вы заметили как на критику капчи на самом яндексе, автор упорно дистанцируется от яндекса, и убеждает нас, что владельцы сервиса сами там должны что-то настроить.

В статье мы описали разработку сервиса SmartCaptcha, который любой владелец сайта может использовать у себя и по своей логике показывать капчу. В том числе SmartCaptcha используется Яндексом.

Простите, а для чего вообще надо использовать это убожество от Я, если Google давным-давно сделал reCAPTCHA v3, максимально дружелюбное и надежное решение? Да, оно тоже изредка глючит, и предлагает отметить или заборы или светофоры, но во 1-х там это происходит ГОРАЗДО реже, а во 2-х никакой кириллицы, которая иностранцу вообще непроходима... Пользуйтесь: https://www.google.com/recaptcha/about/

Думаю статья писалась только из-за того, чтобы узнать недовольства при юзер экспириансе. Хороший ход.

Ты Видишь капчу? А она и думает, что нет!

Как ваша модель обучается? То есть как вы размечаете запросы, которые были от роботов? Это же почти невозможно вручную

Задача отделить роботные запросы от человеческих действительно сложная.
Мы применяем ряд различных подходов: начиная с простых эвристик, заканчивая ML-методами, чтобы выделить роботные запросы. Лучше понимать, роботные запросы перед нами или нет, очень помогает анализ инцидентов на протяжении большого количества времени.

Ну а как вы отличаете запрос от робота при разборе инциденте?

Как вы заметили по комментариям, вы не справились с работой. Ваш сервис полностью бесполезен и только вредит бизнесу вашей компании.

Говорят, если в руках молоток, то всё вокруг кажется гвоздями. То же самое и с Яндексом: когда в руках SmartCaptcha, руки так и чешутся применить её туда, куда не надо.

Примерно неделю назад Яндекс.Картами стало вообще невозможно пользоваться: дурацкая каптча вылезает каждые пять секунд. Почему дурацкая? Потому что на момент появления каптчи в картах был включен «Линейка». А после ввода каптчи на странице этот режим сбрасывается. Его приходится активировать заново, кликая на значок линейки заново. Но вся незадача в том, что после клика на значок линейки вылезает катпча.

Для чего вообще нужна каптча? Чтобы злонамеренные юзеры не использовали ресурс сервера сверх меры. Но если катча вылезает каждые пять секунд, браузеру приходится запрашивать участок карты заново, а это как раз и нагружает сервер! Хотели как лучше, а получили как всегда.

хорошая причина отказаться от яндекса полностью и перейти в гугл
а это все они делают ради того чтобы ты скачал их браузер, там же ее нет, но этим заниматься я точно не стану, лучше в гугл полностью

хотел кстати поблагодарить(пожелать вам гореть в аду) за русскоязычную капчу, очень удобно набирать, если нет русской клавиатуры или если ты не в курсе русского языка вообще.

Хреново вы ее разработали. Она непроходима при использовании Tor

Зарегистрируйтесь на Хабре, чтобы оставить комментарий