Pull to refresh

Comments 74

Скопируйте ссылку, там стоит какая-то фильтрация по заголовку Referer. Долго мучался с настройками прокси в nginx, пока не понял что дело в этом.
Мне обновление помогло :) Не знал про такую «ленту», спасибо!
CAPTCHA — это разновидность обратного теста Тьюринга.
UFO just landed and posted this here
Попозже вечером и не такое будет…
<item found="75253">хенд хантер</item>
<item found="811420">"крутит" левую руку</item>
<item found="66841">вконе</item>
Помнится, лет 5+ назад проскакивало видео, где под музыку-рубилово в течение 5 минут показывался нефильтрованный прямой эфир Яндекса. Просмотр оставлял очень тяжелое чувство боли и обиды за окружающее общество.
UFO just landed and posted this here
Гости страны они такие.
<item found="60">пельменемет</item>

Оказывается и такое есть…
Смысл в обезличивании таких запросов, если по их содержимому можно и так получить: адреса, email, телефоны и многое другое.

<item found="461935">рублевское шоссе 36 корп ...</item>
<item found="171091">+380(50)657....</item>
<item found="35014">458.162.-.1-</item>
<item found="191493">e-mail: archi...@mail.ru</item>
<item found="48">gau-...@mail.ru</item> (email одного ген. директора)
<item found="69">dagteolog@mail.ru</item>
<item found="1061916">алекс.. ив... ,курск ... лет</item>
<item found="210129">Татьяна, 41 год, М... (название поселка)</item>
<item found="5822147">+7 932 421 .. ..</item>

Часто встречаются email адрес людей, телефоны (частные).
UFO just landed and posted this here
Пароли да, при том часто это не вина пользователя, а чистая случайность. Например не дожал Ctrl+V, и вставил в поисковую строку то, что было в буфере перед этим — пароль. Всё, утёк, даже «найти» нажимать не надо.
наверное писалось про Ctrl+C?
«Смысл в обезличивании» в том, что это не всегда емейлы и телефоны авторов запроса. Контент запросов нужно фильтровать отдельно.
UFO just landed and posted this here
Уже давно не предоставляют и не указывают в официальной статистике. О том что народ ищет тайно — стыдно и говорить…
Так было всегда и будет всегда. Умных и успешных людей (миллиардеров, политиков, космонавтов, музыкантов и так далее) вроде бы около 3.5 процентов. Остальные быдло, либо из-за своих комплексов, привычек и (или) проблем не смогли пройти в это число. Думаю повысить этот процент можно, однако потом, если этим не заниматься, опять всё устаканится.
Умных и успешных людей (миллиардеров, политиков, космонавтов, музыкантов и так далее) вроде бы около 3.5 процентов… Остальные быдло

Вы, я так понимаю, себя к умным и успешным относите?
А программистов в один ряд с космонавтами и музыкантами ставите? Вам-то наверное и порно в яндексе искать не нужно, достаточно в зеркало посмотреть
Совсем нет :) Я пока далеко не успешен и умен, с горой недостатков. Так что пока что я скорее 95%. Результаты, кстати, отфильтрованные, однако благо просто посмотреть их мы все можем и выводы напрашиваются сами. Если вы всё ещё верите, что человеки хорошие, то я уже давно разочаровался, в том числе и на себе самом.
Если вы всё ещё верите, что человеки хорошие, то я уже давно разочаровался, в том числе и на себе самом.

А почему мы должны в это верить да еще и разочаровываться? Природу нужно воспринимать такой, какая она есть.

Притом что считать недостатком?
Ну какой сколько людей, столько и мнений. Быть может я еще зеленый и глупый)
Умных и успешных людей (миллиардеров, политиков, космонавтов, музыкантов и так далее) вроде бы около 3.5 процентов

Не уверен что успех и разврат друг друга исключают. Периодически высплывают данные как тот или иной политик замешан в сексуальных домагательствах, развращении малолетних или даже обычном просмотре порносайтов на рабочем месте.
«Человек культурный» — феномен по определению искусственный.
Если лишить человека образования и воспитания, он опускается на уровень «ещё одного вида обезьян».
Поэтому вопрос скорее не «если всё пустить на самотёк», а «какая система распространения культуры и образования» установится силами активных членов общества и сопротивления остальных.
Осознание обществом ценности той или иной культуры вещь весьма относительная и субъективная, и кроме всего прочего замкнута на воспитание.
То есть, если увеличить процент осознанных граждан, не просто мотивированных, но и владеющих технологией повышения осознанности, осознанно выбирающих культурные ценности, возможно мы достигнем качественного скачка, после которого падение доли успешых и эффективных людей станет возможным лишь в результате разрушения защищаемой обществом и традициями инфраструктуры образования и воспитания.
На самом деле там всего ~12000 вариантов запросов крутится.
Чуть подробнее, пожалуйста.
Как узнали, всегда или через какой-то промежуток времени обновляется?
«Грабил» поисковые фразы, для последующего составления семантического ядра.
Скрипт крутился пару суток.
Через несколько часов после старта итоговый файл с фразами увеличиваться перестал.

Через какой промежуток обновляют — не могу сказать, не засекал.
нашел вот такую вещь
http://livequeries-front.corba.yandex.net/queries/?ll1=41.17915089295261,20.867207593750013&ll2=55.63987388074816,47.278340406250024&limit=1000
собственно тут в параметрах строки можно задавать и диапазон.
Используется она самими Яндексовцами в прямом эфире
По идее ты можешь считывать значения из /dev/urandom или /dev/random своего сервера скриптом.
Не очень бы я обрадовался, если бы меня попросили ввести что-то вроде «СТЕЛС ЕСЛИ В БОЮ ВАНИШ МАКРОС» или «rfr ljk;yj yfhfcnfn, [ux», или упаси господь что-нибудь длиннее.
Для этого есть кнопка «обновить», которую даже в reCAPTCHA частенько приходится нажимать.
В reCAPTCHA я это чаще делаю из-за того, что не могу разобрать, чего там написано. Хотя в последнее время мне чаще попадаются числа, что гораздо проще для восприятия, нежели «cl» или «d»
Только с третьего раза получилось верно. И я бы ещё сократил длину фразы.
Надергал из яндекса за пару минут
объектив ФЭД И-61Л\Д 2,8/53
nhfycajhvfnjh nlv-401\380d
USB\VID_07D1&PID_3C16
6x+5y=3 3x+3y=4
диагноз р2 б2z73.1.1, б9R461
مصرية افراح اغاني شعبية
0_o идея хорошая, но фильтровать нужно очень жестко, а то рекапча покажется детской игрушкой )
Меня порадовало «Патятливый»

А вот выдача на «Смотреть блондинка в шоколаде» разочаровала…
Идея отличная. Чем вводить очередные Leveclers Snemrilililibs, лучше уж что-то такое:
самый лучший курятник фото
рыжий шпиц фото
где посылка
кончаться огонь
малолетние граждане это тесты
как отбить бывшую девушку
мыло ручной работы для чего
деский возрост и хурма
корень из 27

(пардон, форматирование не вставилось)
Это просто прекрасно, спасибо!
дон камизи перевод
что такое промокод
как потеет бегемот
почему я идиот

вот тоже не плохо курнули
техника машинного доения
полимеры в авиастроении
если человек не в настроении
половые органы строение
7 июня 2014, гроза
Ну и романтики немного…
кленовые листья раскраска
упрямые женщины ласка
поэма есенин
плащ теплый осенний
гармонь развеселая пляска
UFO just landed and posted this here
Так вот откуда современная попса тексты берет…
Огромное тебе спасибо, добрый человек! Ты просто сделал мой день :)
Поэма
тест на характер человека
что подарить на новый год
синоним к слову картотека
а снег идет а снег идет
енотовидная собака
парфюм по знаку зодиака
как увеличить капитал
скачать владимирский централ
пусть говорят официальный
не плачь и жди меня домой
стерилизатор паровой
костюм джедая карнавальный
картон асбестовый каон
как затуманить задний фон

UFO just landed and posted this here
А будет ли nginx работать в неблокирующем режиме, используя функции imagemagick?
imagemagick используется через FFI, никакие файлы при этом не читаются, так что да.
А где можно почитать про это АПИ и какие условия пользования?
Если я буду его пользовать, то меня быстро забанят или не очень?
Я про АПИ яндекса конечно…
А для гугла такая же выборка есть? Хотел бы сравнить запросы аудитории mail.ru, google и яндекса.
Побочный эффект: эффективно отсеивается нерусскоязычная аудитория. Для кого-то это может быть важно.

Ещё, подозреваю, возможна timing attack (кстати, какой адекватный перевод этого термина на русский язык?).
С такой капчей ждите массового оттока посетителей. Можете даже A/B-тестирование провести
Да не надо ничего проводить даже…
n\c

Гадание по капче получило второе дыхание
Не понял. Т.е. бот может получить тот же список, и подставлять из крайне ограниченного числа вариантов перебором? =) Капча так не работает. Капча работает не так.
А разве количество попыток не ограничивают при вводе капчи? Просто опасть на пересечение двух рандомных фраз одного списка — шанс к нулю стремится.

Вру. Не к нулю. Если бот будет брутфорсить с одной и той же фразой — шанс велик.
image

Извините, но вы меня не заставите вводить этот текст. Лучше уж 12-ти символьную капчу ввести./sarcasm>
Собственно оттуда же и берутся данные
так и вижу как ваш ребенок вводит: «негры гей порно», а потом спрашивает что всё это значит? :)
Кажется хаброэффект и компания Яндекс, читающая хабр, уже прикрыли эту интересную страничку
image
Там просто referer проверяется. Вставьте ссылку в адресную строку и зайдите так.
Мне идея непонятна. Если это юмор, то не смешной. Матан-капча прикольней:
image

Если это для практической реализации, к чему тогда тут запросы к Яндексу? Взяли бы сочинения Пушкина, на строки побили бы и вывели для ввода.
Считать человека круче компьютера в матане может и прикольно, но глупо.
Сочинения Пушкина = известный словарь, а идея брать относительно случайные данные.
Ненавижу тех людей, которые ставят капчу на языке, написание которого отлично от латиницы. У меня на многих устройствах мало того, что нет русской клавиатуры, нет еще и поддержки ввода кириллицы. Задолбали, в общем. Не надо так!
Sign up to leave a comment.

Articles