Как стать автором
Обновить

Комментарии 33

Если защита от ботов действительно “незначительная”, то это ставит под вопрос эффективность всей системы. Зачем тратить время и усилия на решение CAPTCHA, если боты все равно обходят защиту?

Знавал я одного админа, который дпже файрволл не настраивал, говоря, что он предпочитает думать о хороших людях в интернете, а про хакеров сяитает думать ниже своего достоинства. В итоге атаки на его машины атаки шли сплошняком, а он просто из бекапа порой машины восстанавливал - но всяких капч этих ваших все равно не приемлел.

Стоимость прохождения капчи повышать. 10 аккаунтов злоумышленник и вручную зарегистрирует, а вот подключить нейронку - уже вопрос в железе и тд.

Есть сервисы, которые решают капчи за деньги. Там или нейронка или работники. Стоимость копеечная.

Это вообще нелепо, хвалятся достижениями в ИИ, а пользователей принуждают унизительно доказывать, что они не верблюды, наплевав на презумпцию невиновности и benefit of the doubt. Чего ж они свой ИИ не используют для определения, или может это всё пустышка?

Не говоря уж о том, что формулировка "докажи, что ты не нечеловек" отдаёт каким-то цифровым фашизмом.

reCAPTCHA v3 так и делает, анализирует поведение пользователя и его fingerprint, чтобы понять, что это не бот, и высвечивает окошко с капчей только в том случае, если есть сомнения

А тамошний ИИ заточен на то чтобы придумать миллиард способов отклонить запрос "соедини с оператором"

И там даже не для рекламы тратятся училия. Но, кроме голосового приветствия "оставаясь на линии, вы разрешаете вообще все, в т.ч. и спам слать, и вообще все"

Достаточно часто не могу пройти эту (re)CAPTCHA с первого (второго) раза. Вероятно, я наполовину робот. Или просто тупой.

Это и есть доказательство человечности)) боты проходят с первого раза

Так вроде эту (re)CAPTCHA придумали, чтобы не пропускать ботов? (Статью прочитал, совершенно не удивлён, что гоогле зарабатывают многоллиарды денег из ничего)

Так она только для увеличения стоимости парсинга и нужна. Одно дело plain html, другое -- подключать javascript-движок, ИИшку... разница [в стоимости обработки], полагаю, на порядки.

Так на плейн хтмл и сейчас много не напарсишься -- вся полезная информация на страницах генерируется скриптами динамически, так и так приходится подключать что-то для взаимодействия с таким контентом.

Вероятно, я наполовину робот.

Антропоморфная биологическая нейросеть поколения Y.

Ну и где здесь робот?

Второго? В среднем 4..6 раундов капчи с картинками. Максимум был в районе 40 (мне было уже просто интересно, это когда-нибудь закончится?). Как по мне - чистое издевательство. Тем более некоторые картинки вообще нереально решить (опознать автобус в куче пикселей низкого разрешения после какого-то фильтра или найти мотоциклы на азиатской улице забитой вперемешку мото и вело в мелком масштабе). Однако заметил тенденцию: если в какой-то момент затупить - процесс часто заканчивается. Стал тупить намеренно - теперь пускает почти сразу...

Со второго раза - это в среднем. Иногда бывает с первого, иногда - с десятого.

По поводу нереально решить: разрешение не проблема. Проблема - куски автобуса (условно) в квадрате, которые не понятно, считаются как автобус, или же нет?

Ну и в общем "исследование" дурное. Да, сейчас боты умеют обходить и капчу, и рекапчу, но большинство ботов остаются примитивными, и не умеют ни того, ни другого. Так что капча в любом случае помогает отсечь очень значительную их часть. А между обычной капчей и рекапчей, уж простите, я, как пользователь, предпочту потыкать по квадратикам, нежели вбивать символы с картинки, которые часто нечитабельны в принципе.

Символы с картинки достаточно один раз ввести правильно, а эта пакость тебя и десть раз искать переходных пешеходов заставит.

reCAPTCHA отняла примерно 819 млн часов человеческого времени

...

При этом Google за счёт своих возможностей отслеживания и сбора данных получила огромную прибыль, которая только в отношении cookie оценивается в $888 млрд.

Я очень грубо прикинул, что жизнь человека оценилась в $650млн.

Что, кстати, заметно выше, чем общепринятая оценка, которую страховые используют

Его исследование показало, что reCAPTCHA тщательно отслеживает файлы cookie пользователей, историю просмотров и среду браузера (включая рендеринг холста, разрешение экрана, движения мыши и так далее)

o'rlly?

В типовом сценарии reCAPTCHA от Google не имеет прямого доступа к кукам стороннего сайта, поскольку она обычно загружается в iframe с домена Google (например, www.google.com или www.gstatic.com) и работает в рамках другого домена. Следовательно, политика «same-origin» (один источник) не даёт ей возможности «читать» куки, оставленные под доменом посещённого вами сайта.

Кажется, кто-то либо пошутил, либо напи....

скрипт, загружающий рекаптчу, живёт на странице и имеет доступ ко всему, к чему захочет.

Да, но он только и делает что bootstrap'ит рекапчу, а вот она уже делает свои проверки в iframe гугловского домена, отдавая респонс коллбэком на ваш сайт.

Да, чисто технически гугл может изменить этот бутлоадер внедрив в него чтение кукисов сайта, или же делать это в коде самой рекапчи вне контекста ихнего iframe (использование которго просматривается несмотря на минифицирование кода), но вы же понимаете, что это последнее что они сделают - разразится скандал невиданных масштабов и рекапча умрёт навсегда. Эти запросы к куки и слив на сторону гугла были бы видны в утилитах вроде Fiddler, DevTools и т.п., но что-то я не вижу таких доказательств в этом "исследовании".

Буутстрапящий скрипт вполне может (и, думается, так и делает) собирать все желаемые данные. На основании чего-то же каптча делает выводы об активности пользователя. Совершенно разное поведение на активно используемом браузере и на новеньком с нуля (и в инкогнито - троетий вариант). Причём не только на хроме.

вполне может (и, думается, так и делает

"Где пруфы, Билли" (с)

Совершенно разное поведение на активно используемом браузере и на новеньком с нуля

Очевидно же, что у гугла есть/нет своих кукисов (вне домена посещаемого сайта), что и влияет на прохождение теста рекапчи. Причём когда вы посещаете разные сайты в одном браузере, рекапча вас "узнаёт" именно благодаря той инфе, что уже собрала на вас ранее в своём домене, а не ищет судорожно в кукисах чужих сайтов.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости