maybe_elf Feb 9 at 08:07

Исследование: reCAPTCHA стоила пользователям 819 млн часов времени

2 min

4.1K

Information Security * Research and forecasts in IT * Web services testing *

+11

Comments 33

Babaika88 Feb 9 at 08:12

Если защита от ботов действительно “незначительная”, то это ставит под вопрос эффективность всей системы. Зачем тратить время и усилия на решение CAPTCHA, если боты все равно обходят защиту?

achekalin Feb 9 at 09:48

Знавал я одного админа, который дпже файрволл не настраивал, говоря, что он предпочитает думать о хороших людях в интернете, а про хакеров сяитает думать ниже своего достоинства. В итоге атаки на его машины атаки шли сплошняком, а он просто из бекапа порой машины восстанавливал - но всяких капч этих ваших все равно не приемлел.

Ravius Feb 9 at 14:02

Стоимость прохождения капчи повышать. 10 аккаунтов злоумышленник и вручную зарегистрирует, а вот подключить нейронку - уже вопрос в железе и тд.

vaslobas Feb 9 at 17:17

Есть сервисы, которые решают капчи за деньги. Там или нейронка или работники. Стоимость копеечная.

dicrel Feb 9 at 15:14

Это уж от совсем нецеленаправленных мимокрокодилов-дудосеров

anoneko Feb 9 at 08:41

Это вообще нелепо, хвалятся достижениями в ИИ, а пользователей принуждают унизительно доказывать, что они не верблюды, наплевав на презумпцию невиновности и benefit of the doubt. Чего ж они свой ИИ не используют для определения, или может это всё пустышка?

Не говоря уж о том, что формулировка "докажи, что ты не нечеловек" отдаёт каким-то цифровым фашизмом.

Lezvix Feb 10 at 04:07

reCAPTCHA v3 так и делает, анализирует поведение пользователя и его fingerprint, чтобы понять, что это не бот, и высвечивает окошко с капчей только в том случае, если есть сомнения

KbRadar Feb 9 at 09:34

Ещё больше времени потратили пользователи продираясь через ИИ в чатах с банками и прочими ОПСОСами.

grigr Feb 9 at 09:45

А тамошний ИИ заточен на то чтобы придумать миллиард способов отклонить запрос "соедини с оператором"

achekalin Feb 9 at 09:53

И там даже не для рекламы тратятся училия. Но, кроме голосового приветствия "оставаясь на линии, вы разрешаете вообще все, в т.ч. и спам слать, и вообще все"

LexD1 Feb 9 at 09:35

Достаточно часто не могу пройти эту (re)CAPTCHA с первого (второго) раза. Вероятно, я наполовину робот. Или просто тупой.

grigr Feb 9 at 09:43

Это и есть доказательство человечности)) боты проходят с первого раза

LexD1 Feb 9 at 09:49

Так вроде эту (re)CAPTCHA придумали, чтобы не пропускать ботов? (Статью прочитал, совершенно не удивлён, что гоогле зарабатывают многоллиарды денег из ничего)

trinxery Feb 9 at 10:39

Так она только для увеличения стоимости парсинга и нужна. Одно дело plain html, другое -- подключать javascript-движок, ИИшку... разница [в стоимости обработки], полагаю, на порядки.

PanDubls Feb 9 at 12:07

Так на плейн хтмл и сейчас много не напарсишься -- вся полезная информация на страницах генерируется скриптами динамически, так и так приходится подключать что-то для взаимодействия с таким контентом.

pulsatrix Feb 9 at 10:23

Вероятно, я наполовину робот.

Киборг?

LexD1 Feb 9 at 10:30

Антропоморфная биологическая нейросеть поколения Y.

pulsatrix Feb 9 at 15:36

Вероятно, я наполовину робот.
Антропоморфная биологическая нейросеть поколения Y.

Ну и где здесь робот?

DrZlodberg Feb 9 at 20:53

Второго? В среднем 4..6 раундов капчи с картинками. Максимум был в районе 40 (мне было уже просто интересно, это когда-нибудь закончится?). Как по мне - чистое издевательство. Тем более некоторые картинки вообще нереально решить (опознать автобус в куче пикселей низкого разрешения после какого-то фильтра или найти мотоциклы на азиатской улице забитой вперемешку мото и вело в мелком масштабе). Однако заметил тенденцию: если в какой-то момент затупить - процесс часто заканчивается. Стал тупить намеренно - теперь пускает почти сразу...

LexD1 Feb 14 at 16:50

Со второго раза - это в среднем. Иногда бывает с первого, иногда - с десятого.

По поводу нереально решить: разрешение не проблема. Проблема - куски автобуса (условно) в квадрате, которые не понятно, считаются как автобус, или же нет?

Ziptar Feb 9 at 13:27

Мне больше интересно, какого черта госуслуги заставляют меня вбивать обычную капчу при входе по ЭП

Ziptar Feb 9 at 13:55

Ну и в общем "исследование" дурное. Да, сейчас боты умеют обходить и капчу, и рекапчу, но большинство ботов остаются примитивными, и не умеют ни того, ни другого. Так что капча в любом случае помогает отсечь очень значительную их часть. А между обычной капчей и рекапчей, уж простите, я, как пользователь, предпочту потыкать по квадратикам, нежели вбивать символы с картинки, которые часто нечитабельны в принципе.

Vinegar Feb 10 at 03:17

Символы с картинки достаточно один раз ввести правильно, а эта пакость тебя и десть раз искать переходных пешеходов заставит.

Ziptar Feb 10 at 06:37

Зависит от условий. Тем, кто за CGNAT сидит - соболезную.

Squxee Feb 9 at 18:09

Когда прошел reCAPTCHA, но мог потратить эти 10 секонд на саморазвитие

ArtMan99 Feb 9 at 22:06

Когда уже можно будет обучить ИИ-бота проходить за тебя эту капчу?)

Mishootk Feb 10 at 08:53

reCAPTCHA отняла примерно 819 млн часов человеческого времени
...
При этом Google за счёт своих возможностей отслеживания и сбора данных получила огромную прибыль, которая только в отношении cookie оценивается в $888 млрд.

Я очень грубо прикинул, что жизнь человека оценилась в $650млн.

PanDubls Feb 11 at 09:46

Что, кстати, заметно выше, чем общепринятая оценка, которую страховые используют

Frankenstine Feb 10 at 11:32

Его исследование показало, что reCAPTCHA тщательно отслеживает файлы cookie пользователей, историю просмотров и среду браузера (включая рендеринг холста, разрешение экрана, движения мыши и так далее)

o'rlly?

В типовом сценарии reCAPTCHA от Google не имеет прямого доступа к кукам стороннего сайта, поскольку она обычно загружается в iframe с домена Google (например, www.google.com или www.gstatic.com) и работает в рамках другого домена. Следовательно, политика «same-origin» (один источник) не даёт ей возможности «читать» куки, оставленные под доменом посещённого вами сайта.

Кажется, кто-то либо пошутил, либо напи....

rombell Feb 18 at 09:57

скрипт, загружающий рекаптчу, живёт на странице и имеет доступ ко всему, к чему захочет.

Frankenstine Feb 18 at 10:34

Да, но он только и делает что bootstrap'ит рекапчу, а вот она уже делает свои проверки в iframe гугловского домена, отдавая респонс коллбэком на ваш сайт.

Да, чисто технически гугл может изменить этот бутлоадер внедрив в него чтение кукисов сайта, или же делать это в коде самой рекапчи вне контекста ихнего iframe (использование которго просматривается несмотря на минифицирование кода), но вы же понимаете, что это последнее что они сделают - разразится скандал невиданных масштабов и рекапча умрёт навсегда. Эти запросы к куки и слив на сторону гугла были бы видны в утилитах вроде Fiddler, DevTools и т.п., но что-то я не вижу таких доказательств в этом "исследовании".

rombell Feb 18 at 10:47

Буутстрапящий скрипт вполне может (и, думается, так и делает) собирать все желаемые данные. На основании чего-то же каптча делает выводы об активности пользователя. Совершенно разное поведение на активно используемом браузере и на новеньком с нуля (и в инкогнито - троетий вариант). Причём не только на хроме.

Frankenstine Feb 18 at 11:09

вполне может (и, думается, так и делает

"Где пруфы, Билли" (с)

Совершенно разное поведение на активно используемом браузере и на новеньком с нуля

Очевидно же, что у гугла есть/нет своих кукисов (вне домена посещаемого сайта), что и влияет на прохождение теста рекапчи. Причём когда вы посещаете разные сайты в одном браузере, рекапча вас "узнаёт" именно благодаря той инфе, что уже собрала на вас ранее в своём домене, а не ищет судорожно в кукисах чужих сайтов.