Комментарии 186
даже при выходе из аккаунта и переходе в анонимный режим, Google продолжает подстраивать поисковую выдачу согласно ранее собранной о пользователе информации
Пользуйтесь виртуальными машинами. Я правда в последнее время стал скептически посматривать и на "попользовался машиной — откати к нулевой точке восстановления" (там, где чистая операционка) и всё больше засматриваюсь в сторону автоматического создания виртуалок и ещё мне интересно, не придумают ли скоро технологии, когда фингерпринт виртуальной машины будет содержать параметры хост-машины (а что, ведь выход из виртуальной машины уже давно умеют делать, скажем вирусы-трояны)
Пользуйтесь виртуальными машинами
А что насчёт IP адреса (и сопутствующей геолокации по нему)?
Или ещё и прокси к виртуалке привязывать нужно?
Правда, Гугл может отобразить страницу на неизвестном языке и обвинить Вас в том, что Вы — робот. o_O
Пользуюся я как DuckDuckGo так и ipv6.google.com. Выборки — разные. Аккаунта жужль у меня нет, так что даже не логинился никогда.
Не, можно конечно, подключиться через разные сервера (вроде пять серверов на аккакунт дают, да и аккаутов можно несколько завести) и по крону их рандомно переключать на руотере. Но это — вышак.
При этом наблюдается другой забавный «баг» Гугла — у него свои закрытые алгоритмы геопривязки IP с непонятной логикой. Когда все другие сервисы верно определяют страну (под верно я понимаю, что трафик с сервера физически уходит через маршрутизатор провайдера в какой-то стране (легко проверить c помощью trace ) Гугл решает «по своему». Особенно часто проблемы как раз с виртуалками.
Очень жаль, что вам непонятно, как открыть файл с инструкцией (где написано про private window), зато понятно, как написать комментарий на Хабре о ваших непонятках.
Ощущение, что гугл так троллит :)
«Бог Ответит Тебе.» — БОТ
Страшно подумать, чем обернётся…
Хотя, это идея для троллинга всяких церковников:
- А какой бог — более истинный?
Тот, который в интернете (Гугл выдаёт)
или тот, картинки с которым здесь у вас?
Хотя иногда могут быть и забавные ситуации с подобной рекламой. В частности пару месяцев назад на хабре в какой-то из статей такой рекламный блок, прилегая к чьему-то комменту образовал забавный микродиалог который выглядел примерно так:
— «Пытаешься найти бога?»
— Это всего лишь список констант с адресами регистров.
Да ладно, на телефоне в хроме, используемом для чтения новостей подряд на rbc и interfax-е а так-же habra в основном по дороге на/с работы постоянно висела реклама сайта знакомств надоело ткнул крестик, там варианты "почему", наиболее честным вариантом оказалось " услуга оказана" так после этого стала показываться реклама сайта вида "любовница по расчёту" :)
Google продолжает подстраивать поисковую выдачу согласно ранее собранной о пользователе информации
Для этого нужно показать корреляцию пользователя и информации. В материале есть лишь различие получаемых данных разными пользователями. Этому может быть и иное объяснение.
Несколько человек вообще не видели инфобокса
Вот это похоже на эксперимент от самого гугла
В идеальном мире анонимного поиска каждый пользователь, который не захотел предоставлять Google свои персональные данные, должен получать один и тот же набор наиболее релевантных ссылок на свой запрос, как и любой другой пользователь из его страны.
Конечно, нет. Анонимность не имеет никакой связи с вариативностью: Гугль может слегка перемешивать поисковую выдачу для всех пользователей, чтобы потом использовать результаты для улучшения релевантности для всех пользователей.
ЗЫ: гуглаккаунта нет.
Tor при раскрытии на весь экран предупреждает — не надо так делать — это добавляет информации следящим...
С этой точки зрения в моём примере плохо вообще всё, начиная с использования ишака.
БОльшие размеры картинки — бОльшие угловые размеры изображения в окуляре?
Это надо быть параноиком с манией преследования.
Вот например, мне потребовалось узнать физические размеры (высоту/диаметр) банки бнв-1000. И что же? Google завалил всю выдачу ссылками на мотоциклы BMW, и пришлось изрядно потрудиться над запросом, чтоб найти искомое.
Или вот если вам нужно найти статьи по настройке VNC, то он забьёт всю выдачу статьями про мобильного оператора МТС.
Или если вы хотите найти статьи по созданию плагинов к Firefox Mobile. Именно Mobile, потому что там всё кардинально отличается от десктопной версии. Но заставить Google выдавать только те странички, где есть слова «Mobile» и «Android» невозможно в принципе, он выдаст вам вообще все статьи про создание Firefox-плагинов, и найти в этой выдаче те, где речь идёт о мобильной версии, не проще, чем иголку в стоге сена. Тут даже поиск по базе знаний Mozilla даст более релевантные результаты.
Вообще, выполнить самый обычный строгий поиск, чтоб в выдаче оказались те и только те страницы, где по Ctrl+F найдётся каждое слово запроса, уже давно невозможно. Теперь Google сам решает, что конкретно вы ищете. И если его мнение отличается от вашего — что ж, вам не повезло. Ну это общая тенденция сейчас, мол сервисы должны не удовлетворять спрос, а создавать его. Но это в любом случе нельзя называть поиском. Это именно впаривание, которое в некоторых случаях лишь создаёт иллюзию поиска.
Уж молчу про откровенный поисковый мусор, когда всякие pinterest'ы и прочий шлак иногда по 5-6 страниц занимают.
Вот например, мне потребовалось узнать физические размеры (высоту/диаметр) банки бнв-1000. И что же? Google завалил всю выдачу ссылками на мотоциклы BMW, и пришлось изрядно потрудиться над запросом, чтоб найти искомое.
Поставить две кавычки — это "изрядно потрудиться"?
Немного другой пример — меня как-то откровенно утомила попытка гугля сделать автозамену «ms sql» на «my sql». Это не «изрядно потрудиться», если вам нужно один запрос, но так как отключить эту автозамену практически нельзя, и вы регулярно ищете что-то подобное, такое поведение способно просто достать.
Фактически, я бы на сегодня ВСЕ запросы писал бы в кавычках, чтобы всю подобную логику отключить. Назвать это достижением язык не поворачивается.
Мне не было нужно my sql, мне нужно MS.
Так вам нужен был НЕ me sql, а ms sql, и поэтому вы для предсказуемости искали my sql, а НЕ ms sql?
Вот на сегодня например такой автозамены уже я не вижу.
Ну они развиваются, потихоньку. Искусственные интеллекты, я имею в виду.
Немного другой пример — меня как-то откровенно утомила попытка гугля сделать автозамену «ms sql» на «my sql».
А я этой автозамены не вижу.
Ну то есть проблему починили, но вы все равно недовольны.
Это я еще перевод не вспоминал, когда слова в кавычках автоматически переводятся на другой язык, и ищутся.
Это не всегда помогает, в яндексе раньще был отличный способ +словоКотороеДолжноБыть -словоКоторогоНеДолжноБыть но теперь так не работает....
"бнв-100" размеры
Если представить себе, сколько человек набирает «бнв», имея в виду именно BMW… Если у гугла есть какой-то алгоритм, сопоставляющий набранное с кликнутым, то он стопудово сделает именно такой вывод.
Самое удивительное то что Яндекс и без "-bmw" нашёл то что нужно..
Яндекс хотябы пока выводит строку автозамены, в которой можно быстро вернуть запрос на место...
Причем такая же фигня была проделана похоже и с картами — т.е. налицо явные попытки заменить поиск данными из «каталога». Оплаченного, ясное дело.
>просто невозможно же вычислить
Насколько я понимаю, наличие плюса не усложняет вычисления. А отсутствие кавычек (то есть, мы ищем и синонимы) наоборот, как раз усложняет.
Рассмотрим простой пример: есть запрос1 (МТС), который интересен 99% людей, и запрос2 (VNC), который интересен 1%, и есть вероятность, пусть это будет 3%, что человек, искавший запрос1, сделал ошибку, и написал его, как запрос2 (забыл сменить раскладку).
Простое правило типа
if(query == 'VNC') {
query = 'МТС'
}
в ядре гугла сразу повышает статистику попадания для запроса VNC с 25% до 75%. Все очевидно.
А в реале перекос может быть и 99.999%/0.001%, и понятно, под что обучатся самообучаемые алгоритмы. Так что да, такая вот диктатура большинства выходит. Хорошо, что есть лайвхаки типа запросов с кавычками, или стоп-слов. Но я не буду удивлен, если завтра и они исчезнут, ведь продакты гугла решат, что поддерживать фичу, которой пользуется меньшинство, ценой усложнения реализации хранилищ и ядра, глупо.
Попробуй просто нагуглить документацию и статьи по новому Angular, который не AngularJS. Видимо, боль и страдания — неотъемлемая часть философии этого фреймворка.
А так, добавление контекста обычно сильно помогает гуглу сориентироваться, например, дописать document.querySelector – и вариантов, использующий jQuery, в результатах не будет. К тому же, оно помогает ему еще и искать точнее.
Но лишь только захочется странного, отличного от того, что ищет 95% населения…
Так это всегда так было. Лет 8 назад захотел я завести аквариум. Гугло-яндексы показывали только сделанные на коленке сайты визитки с 1-2 статьями про заведение аквариума и все. Огромный русский форум про аквариумы, на котором есть абсолютно все от статей про гуппи, до тропических жаб, нашел только спросив напрямую у когото в комментах.
Прошло несколько лет, решил я занятся настольным Вархаммером. Ситуация повторилась — вся выдача в коленочных магазинах на вордпрессе, а огромный русский форум с тоннами текста по делу удалось найти только спрашивая у людей в комментариях.
1) Геозависимые и геоНЕзависимые запросы
yandex.ru/company/technologies/regions
2) Результаты сравнивались из разных дата центров.
Скорее что-то типа А/Б тестов, или генетических алгоритмов, оптимизирующих выдачу.
Вряд ли имеет смысл на каждом шарде пересчитывать запрос заново, когда можно его закешировать хотябы на уровне страны, и отдать за О(1).О! Отличный вопрос для собеседования. Любому программисту, который подумает над вашей идей несколько минуть должно стать понятно почему она не просто плоха, но катастрофически плоха. То есть: она не просто не принесёт ускорения, но ухудшит результаты.
Подсказка: дать ответ на запрос из одного слова — проще, чем на запрос из 10 слов.
Скорее что-то типа А/Б тестов, или генетических алгоритмов, оптимизирующих выдачу.Да, это ещё одна причина.
Хотите полной анонимности — заходите из-под виртуальной машины на удалённый сервер, там запускайте другую виртуалку, подключайтесь к vpn — и вперёд!
Дык наверняка Google Chrome пользовались (ещё и отправка анонимных данных наверное включена), очевидно ж там свой сквозной идентификатор. Ещё не надо удивляться похожим артефактам, связанным с ОС Android
А меня бесит реализация рекламы у них. Я вот хотел купить тележку для трактора-газонокосилки. Поискал в Гугл предложения, нашёл самую подходящую и страдая муками выбора, купил. Оказалась хрень, ржаветь начала видимо еще на заводе, но возвращать геморрой — поэтому пользуюсь. Но теперь на любом сайте, где реклама не заблокирована мне предлагают разные прицепы для трактора, каждый раз заставляя вспоминать какую дрянную телегу я купил. Я уж и так и эдак пытался убрать из рекламы такую выдачу, но все равно Гугл считает, что тележку я купил плохую и надо купить получше., Теперь для себя решил что весь выбор товара надо делать как минимум в приватном режиме, т.к. пользы от их контекстной рекламы для себя не увидел ни разу, а раздражает она знатно.
Гугл считает, что тележку я купил плохую и надо купить получше
Разве он не прав?
Вместо инкогнито режима можете запускать браузер с чистым профилем. Тогда это будет больше похоже на правду. Но все равно останется ряд моментов, которые вас помогут выдать. Например, особенный набор файлов на жестком диске со специфическим временем последнего изменения.
Вы можете конечно отключить отправку аналитики, если укажете все нужные настройки около 30 штук. Желательно в момент создания нового профиля. Вот selenium с этим неплохо справляется. Или будете с нуля поднимать виртуалки. А лучше и то и другое вместе. Однако часть функциональности в современных сборках хрома не отключается. Например антивирусная защита под виндой.
Эти люди сначала вводили заранее оговоренные и общие для всех запросы в анонимном режиме, который по идее должен обеспечивать выборку, свободную от влияния внешних факторов типа истории поиска, а после — из под своих учетных записей. Поиск производился всеми добровольцами одновременно (эксперимент проводился 24 июня 2018 года в 21:00), сначала в приватном режиме без логина, а после — из под своих учетных записей.
И все это с того же IP, а не через какую-нибудь тор-прокладку. Исследователям пять за смекалку.
А ещё в андроиде в играх вечно продаются женские трусы с юлы и попытки как-то повлиять на выдачу бесполезны. Гугл соглашается и через несколько показов подобных игрушек и машин премиум класса (я целевая аудитория?) опять предлагает женское бельё.
Яндекс не лучше. То что в яндекс почте крутит продажу шин не один год (у меня нет машины и ничего такого с моего компа не искалось) и предлагает купить компьютерную мышь, хотя оценки нескольких манипуляторов я искал на маркете год назад и всё давно купил.
Нужно сливать бюджеты. Вот и всё.
Так вот не пойму, зачем такого качества поиск насильственно впихивать (понятно, что бабки, но все же).
И второй вопрос — зачем делать телефоны и прочее, когда даже с поиском поле непаханное для улучшений?
Поэтому нет значения вышел ты или нет, у гугла куча возможностей продолжать трекать тебя через ту же аналитеку, кнопки, «партнеров»(банки/мобильные операторы/провайдеры торгуют данными и гугл с удовольствием платит), а андройд сдаст все остальное. Имея такую кучу данных, ценнейшую поведенческую инфу и диплернинг, уже можно деанонить с магической точностью.
Поздно. Теперь ты можешь выбрать только логотип на зонде.
Так же о людях много знают браузеры. Заметьте, что они все почему-то бесплатны. За другие программы надо платить, а браузеры навязывают бесплатно. Значит кто-то платит разработчикам за собранную информацию.
Когда приходит осознание столь очевидной вещи, то становится понятной невозможность найти искомое. Особенно это заметно, если вы используете google dorks.
Я провёл несколько экспериментов в течение длительного времени и могу утверждать, что 9 из 10 пользователей вообще никогда не получают ответов от google. Они работают только с содержимым текущего кэша GGC. От этого и становится заметен «пузырь». Более того есть периоды когда кэш «замораживают». Я рисовал график таких «заморозок» поиска. Он всегда совпадает с громкими политическими событиями и крупными рекламными компаниями.
Google всегда был империей зла, удачно позиционируя себя на рынке — мы же помним, кто первый кричит «держит вора».
9 из 10 пользователей вообще никогда не получают ответов от google. Они работают только с содержимым текущего кэша GGC.
А GGC, откуда информацию, по вашему, берет? Вы, вообще, знаете, что такое "cache" в названии Google Global Cache? Зачем он вообще нужен?
Я рисовал график таких «заморозок» поиска. Он всегда совпадает с громкими политическими событиями и крупными рекламными компаниями.
Все абсолютно логично: громкое событие => всплеск популярности у запроса => попадание в кэш.
Вы по любому популярному запросу будете ответ от GGC получать. Он именно для этого и создан — отвечать известными ответами на популярные запросы, чтобы разгрузить датацентры.
Да, был у меня однажды случай: Введя мною выдуманное имя в Гугле ничего не нашлось. "Уникат!" — подумал я.
Спустя некоторое время, по этому же запросу, было пара страниц с результатами поиска. Неудивительно в общем, но насчет "заморозок" неплохо бы было приложить ссылку, чтобы почитать.
А вот к гуглу идут всякие профессиональные вопросы, типа «kapacitor testing framework» и т.д.
Похоже скоро перестану пользоваться и поиском, т.к. все чаще не могу найти нужную информацию по рабочим вопросам. DuckDuckGo на некоторых запросах показывает себя лучше, а житейские типа «кошачий корм» — Yandex
Стоит ребенку зайти посмотреть мультик, так вся моя подборка — это мультики.
Можно открывать ребенку в режиме икогнито или иметь специальный профиль браузера/второй ютуб аккант. Надо только не забыть переключиться перед включением мультиков.
Google Play Music
Там можно 50000 своих песен загрузить и слушать везде без всяких подписок. Я всю свою коллекцию загрузил и горя не знаю.
Уникальность результатов и предвзятость — совершенно разные вещи.
В поиске одновременно(!) идёт большое число (сотни) экспериментов (A/B тестирование). Каждый (!) пользователь участвует в нескольких сразу. Набор экспериментов для каждого уникален, с хорошей точностью. Поэтому да, результаты уникальны.
Эксперименты пользователю назначаются случайно, на основе hash(ID), который присваивается даже анонимному пользователю при первом обращении. Но случайное исправление выдачи ≠ предвзятость.
В поиске одновременно(!) идёт большое число (сотни) экспериментов (A/B тестирование).
У вас есть какие-то подтверждения, что это количество большое?
После известных событий они больше поиском не занимаются, но я сомневаюсь, что с тех пор стало меньше экспериментов.
На следующий день все магазины предлагают мне паяльники.
Где логика. Я уже купил, нафиг мне ещё 1000 паяльников.
P.S. Для «терморектального криптоанализа» достаточно одного, он омногоразовый. Или они должны быть стерильными? И каждому пациенту обязательно нужен свой.: О
каждому пациенту обязательно нужен свой
Разумеется, вы же не хотите чтобы ваши «пациенты» подхватили какую нибудь заразу?
Ну так гугл же не знает, что вы уже купили.
У меня есть подозрения, что если следовать до сайта магазина (и покупать онлайн) через выдачу гугл шоппинг, то гугл засчитает покупку.
При таких условиях ожидалось, что все пользователи +\- получат схожую поисковую выдачу, так как запросы производились примерно в одно и тоже время, из одной страны и в определенном порядке.
означает расписаться в том, что ты не понимаешь в принципе как работают современные поисковые алгоритмы.
И речь тут совсем не в том, что Google или любой другой пытается использовать Вашу историю поиска или ваш профайл. А в том, что любой поисковый алгоритм должен понять что лучше. И понять это он может не только на основании оценочных факторов своих алгоритмов, а и на основании того как посетитель прореагирует на тот или иной проект. Сейчас это называют поведенческие факторы. И понять это можно только показав тот или этот проект посетителю. Потому совершенно логично, что выдача все время разная, потому как поисковая машина экспериментирует с выдачей показывая посетителю выдачу с разной степенью релевантности запросу, чтобы уточнить для себя этот запрос.
Предполагать, что выдача всегда для всех и для каждого каждый раз должна быть одинаковой, это остаться в 90тых годах, когда о таком поиске только размышляли.
Yes! (You can be tracked!)
41.86 % of observed browsers are Firefox, as yours.
0.93 % of observed browsers are Firefox 63.0, as yours.
56.56 % of observed browsers run Windows, as yours.
26.45 % of observed browsers run Windows 7, as yours.
3.16 % of observed browsers have set «ru»as their primary language, as yours.
20.25 % of observed browsers have UTC+2 as their timezone, as yours.
However, your full fingerprint is unique among the 907907 collected so far. Want to know why?
чет как-то не тянет на уникальность. Ещё есть какой-то panopticlick.eff.org. Первые 3 теста yes, 4й no, последний «Does your browser protect from fingerprinting?» вообще не выполнился ибо FF + uBlock + Ghostery + Decentraleyes. И да, ещё у меня стоит удаление куков при закрытии браузера.
Так что я склонен считать отпечаток слишком переоценённым. Если не стоят адблокеры, то вас 110% идентифицируют через адкуки, а если они блокированы — слишком мало параметров, за которые можно зацепится. Особенно если dynamic IP.
PS. Ок, нашел ещё некий HTML5 Canvas Fingerprinting. Однако же в комментах там пишут что не такой уж он уникальный, да и CanvasBlocker есть…
Зря мучались, одного Ghostery вполне достаточно для фингерпринтинга.
чет как-то не тянет на уникальность
Почему не тянет?
«However, your full fingerprint is unique among the 907907 collected so far.» — полный профиль вашей системы уникален среди миллиона уже собраных профилей.
Есть разные способы. Часть из них доступна лишь разработчикам браузеров, часть их партнерам, часть владельцам инфраструктуры. Хром и лиса при установке создают ряд уникальных id, которые регулярно отправляются вместе с данными мониторинга. Есть мутный drm, для поддержки которого браузеры скачивают бинарный код со аффилированных ресурсов. На уровне SSL и TLS есть свой аналог кук, используемый для ускорения процесса создания соединений, но который можно использовать и для других целей. Все для вашего удобства.
Ublock тоже детектится и его наличие/отсутствие это ещё одна "метрика", всё зависит от желания, в принципе тут борьба меча и щита, разрабы ff пытаются снизить возможность слежения сторонними сервисами/разраьы следилок пробить защиту. В итоге на некоторых особо жаждущих сайтах у нас либо всё тормозит (fb) либо докажите что не бот и т.п. (так как даже производительеость в js пытаются использовать) :)
Но браузеры плка (на мой взгляд) побеждают в случае пользователей с похожим на ваше поведением, но при этом проигрывают в массе (и кстати если у вашего провайдера вы такой 1 то со временем и на вас портет будет для всех ip провайдера :))
Если рассматривать поисковую выдачу и избавление от «пузырей», то есть варианты типа duckduckgo. Даже есть всякие startpage.com, которые работают как прокси, выдают точную копию выдачи гугла на поисковые запросы, только без учета таргетирования и слежения. Почему бы не использовать альтернативы?
Всё что надо знать о "бесплатных" сервисах в интернете: "если вы не платите за товар, значит вы и есть товар".
Google держит вас в персональном «поисковом пузыре» даже если выйти из аккаунта