С технической точки зрения это возможно. С практической точки зрения, это очередной аналог трёхбуквенного решения. По своей сути инкапсуляция нужного трафика в какой-то незаметный трафик. Как только это будет сколько-нибудь массово, это тут же встанет под контроль.
Я уж не говорю про то, что это решение требует дополнительных участников в иностранном цифровом пространстве. Этот второй модем должен же существовать там и мы ему должны деньги платить за его работу.
Т.е. это не побочная функция, которую мы внезапно придумали.
P2P соединения внутри страны всё ещё возможны большим количеством способов. А вот вывод трафика в иностранных провайдеров без фильтрации посередине затруднён.
Пожалуйста, прокомментируйте мой предыдущий тезис. Вы это называете статистикой, не перс.данными. Вы говорите, нельзя идентифицировать пользователя.
Я вам привожу верхнеуровневую методику идентификации на основе тех данных, которые вы сообщили. Вы имеете:
IP без последнего октета
Разрешение экрана
Версию ОС
Локаль
Как я вам ранее говорил, провайдеры, как правило, отдают клиентам адреса с маской не более /16. Т.е. это 65534 хоста. Т.е. у вас есть понимание, что это один из 65534 хостов конкретного провайдера. Далее вы берёте доп.параметры и составляете достаточно уникальный отпечаток браузера. Т.е. вероятность совпадения при таких вводных стремится к нулю IP 192.168.0.X, 1920x1080, Win10 22H2, ru_RU.UTF-8.
Конкретные числа могут варьироваться. Клиенты за NAT, поэтому каждый белый адрес это не 1 клиент, а десятки или сотни. Но мы же тоже оперируем только несколькими параметрами. А вы говорили, что знаете ещё что-то.
Мы вновь говорим об одном и том же. Я вновь процитирую своего собеседника из начала ветки обсуждения:
а данные о разрешении экрана, версии ОС, языке и прочая стандартная статистика отправляются на сервер статистики Vivaldi для подсчёта количества активных версий браузера - на сервере все стат.данные обезличены благодаря удалению последнего сегмента IP
Ну тут же чётко, русским по белому написано - собираем кучу инфы для подсчёта количества активных версий. И обезличиваем отбросом последнего октета IP.
Я же дальше в ветке развернул свою мысль, что по этим данным можно составить отпечаток браузера и создать уникальный ID. Что отброс октета не является обезличиваем, а лишь немного увеличивает группу подобных клиентов.
Я вам и всем читающим отчаянно пытаюсь доказать, что (далее цитаты ваших комментариев):
данные о разрешении экрана, версии ОС, языке и прочая стандартная статистика отправляются на сервер статистики Vivaldi для подсчёта количества активных версий браузера - на сервере все стат.данные обезличены благодаря удалению последнего сегмента IP
избыточны для
Нам важно знать, сколько у нас браузеров работает в мире, чтобы понимать, правильно ли мы ведём разработку.
Я не думаю, что ваши коллеги и ваша компания не понимают этого. Компания достаточно успешна, значит там работают не глупые люди =)
Мало того, я вынужден признать, что и вы конкретно не зря едите свой хлеб. Ибо вы как хороший фокусник показываете одно, когда на самом деле есть другое. И даже тогда, когда я вам показываю противоречия в ваших словах, вы не сдаётесь и невозмутимо продолжаете словесную акробатику. Серьёзно, вы хорошо решаете задачу репутации бренда, даже с таким вредным и придирчивым оппонентом, как я.
В целом, мы достигли некой асимптоты в нашей дискуссии. Я вам указываю явные противоречия в ваших словах, привожу конкретные методики идентификации пользователей на основе той "статистики по количеству экземпляров браузера", которую вы собираете. Вы мне беспринципно пытаетесь доказать, что вы не идентифицируется пользователей на основе этой статистики.
Поэтому считаю нашу дискуссию законченной. Успехов вам!
А сколько мы собираем? Версия браузера, платформа, разрешение экрана, язык локали - всё это исключительно статистические данные, которые позволяют нам понимать, каким платформам надо отдавать предпочтение при исправлении багов, какие баг-репорты можно отложить из-за малого числа таких машин, и т.д. и т.п. У нас есть только те данные, что нужны для разработки браузера.
Мы тут с вами в трёх ветках обсуждаем, что браузер собирает данные исключительно для подсчёта количества. И именно вы лично это количество регулярно считаете. А теперь вы откровенничаете, что это всё-таки не только количество, но и какая-то статистика популярности, нужная для разработки.
Вы просто видите, запустился этот браузер сегодня или нет. Всё. Вы не знаете, где он запустился, кем, в какой стране, на каком компьютере.
Но вы знаете 3 октета IP адреса, вы знаете разрешение экрана, версию ОС, локаль (это к слову о стране) и "прочая стандартная статистика".
Не нужно искать чёрную кошку в тёмной комнате, тем более, если её там нет.
А мы и не ищем. Мы просто констатируем факты, опираясь на ваши слова. А далее я предлагаю варианты, как эти факты можно интерпретировать. Я не говорю, что вы их так интерпретируете, нет. Но вы эти данные собираете и существует возможность эти данные именно так интерпретировать.
Ещё раз: ID присваивается копии браузера, а не пользователю.
Ещё раз. Я говорил о том, что в абсолютно подавляющем количестве случаев, одной копией браузера пользуется один человек. Современные ОС многопользовательские, поэтому даже если комп один, то учёток две, копий браузера две. И идентифицируя браузер вы вполне идентифицируете человека.
Технические данные о платформе, разрешении, версии браузера нам нужны для того, чтобы правильно выстраивать приоритет при исправлении багов и при добавлении новых функций. Цвет ваших носков никак на разработку не влияет и поэтому нам не нужен. Вы зря утрируете вместо того, чтобы включать логику.
Включаю логику на максимум своих небольших возможностей. Читаю ваш первый комментарий в ветке комментариев
Уникальный ID присваивается не пользователю, а копии браузера, а данные о разрешении экрана, версии ОС, языке и прочая стандартная статистика отправляются на сервер статистики Vivaldi для подсчёта количества активных версий браузера
Ещё раз и по частям.
данные о разрешении экрана, версии ОС, языке и прочая стандартная статистика отправляются на сервер статистики Vivaldi для подсчёта количества активных версий браузера
Нет. Вас нельзя идентифицировать. Статистика количества браузеров этой информации не даёт.
Какое-то голословное утверждение. Вы для своей статистики собираете достаточно информации, чтобы идентифицировать. Провайдера врядли выдают адреса на клиентов с префиксом более /16. Т.е. в одной подсети не более 65534 клиентских устройств. А то и того меньше. Выборка не очень большая, с учётом того, что это конкретный провайдер. Далее вы собираете данные о разрешении экрана, версии ОС, языке. Есть ещё "прочая стандартная статистика", но мы же не знаем, что под этим подразумевается. Поэтому не будем использовать. И вот теперь давайте прикинем. На основе IP без последнего октета мы знаем, что это один из 65534 клиентов. Далее мы сужаем выборку фильтруя через комбинацию разрешение экрана+версия ОС+язык. Даже если мы не дойдём до одного хоста, мы снизим количество до сотен, если не десятков хостов.
Алгоритм обработки данных статистики не менялся уже сотни лет - мы просто считаем количество браузеров. Лично я считаю, каждый месяц публикую в компании отчёт о том, как растёт наша аудитория пользователей.
Лично вы считаете количество. А ваши коллеги считают что-то другое =)
И вы ловко проигнорировали самое главное. Зачем вам для простой статистики количества столько дополнительных данных? Ну и что, что сайты собирают это всё. Вашей компании зачем эти данные?
Как разрешение экрана, локаль и версия ОС поможет посчитать количество? Не провести некую комплексную аналитку, а именно посчитать количество, о котором мы тут говорим.
Так вы можете объяснить, зачем для подсчёта количества браузеров вы собираете столько информации о браузере? Что будет, если вы будете собирать меньше этой информации?
Например, генерировать уникальный хеш при первом запуске. И единожды отправлять его на сервер. Тогда вам не нужны дополнительные факторы.
Уникальный ID присваивается не пользователю, а копии браузера
Вы убираете 0,00001% юзеров, которые пользуются двумя браузерами. И даже вы не их убираете, а только некую часть их цифрового отпечатка, который остаётся в другом браузере.
данные о разрешении экрана, версии ОС, языке и прочая стандартная статистика отправляются на сервер статистики Vivaldi для подсчёта количества активных версий браузера
Давайте ещё раз и по частям.
данные о разрешении экрана, версии ОС, языке и прочая стандартная статистика
отправляются на сервер статистики Vivaldi
для подсчёта количества активных версий браузера
Хотите я вам ещё цвет своих носков скажу для подсчёта "количества активных версий браузера"?
на сервере все стат.данные обезличены благодаря удалению последнего сегмента IP.
А вам он и не нужен, этот последний октет. Какая разница какой конкретно я из нескольких сотен клиентов (в зависимости от маски сети) моего провайдера? Вкупе с остальными отпечатками браузера и вашей "статистикой количества активных версий браузера" меня вполне можно идентифицировать. Не деанонить, но идентифицировать. Деанонить можно потом, зная множество факторов.
И, кроме того, весь код счётчика статистики выпущен под открытой лицензией и доступен для изучения вместе с исходным кодом Vivaldi.
Спасибо, конечно. Опен сорс это всегда хорошо. Но ведь вы не открываете алгоритмы обработки "статистики количества активных версий браузера", в которой "данные о разрешении экрана, версии ОС, языке и прочая стандартная статистика".
В общем, очень грустно, что непроверенная и, порой, откровенно ложная информация публикуется на Хабре без малейшего намёка на объективность и хотя бы попытку проверить подлинность того, о чём пишут другие ресурсы с сомнительным авторством.
Вот с этим полностью согласен. Я тоже за авторитетные, честные и подкреплённые фактами мнения. И я против манипуляций из букваря манипуляций, ловкой словесной акробатики типа "вы платите столько же, но чаще" и прочих ухищрений для сокрытия истинных целей. Мы ведь все тут за всё хорошее и против всего плохого, правда?
Стояла ли перед вами такая же задача, как стояла перед персонажем из статьи? Если стояла, как вы её решили?
Я тоже не специалист по приготовлению супов (вроде бы это называется повар). Но когда передо мной ставится задача приготовить суп я изучаю лучшие практики, читаю чужие советы, рекомендации, лезу в нейронку, в конце концов. При этом я сохраняю скепсис понимая, что нейронка может мне посоветовать откровенный бред или даже что-то опасное.
Уважаемый суд не смутило, что один IP закреплён* за двумя агентствами недвижимости. Чтобы этот "IP" из себя не представлял, это нормально, что у двух разных организаций закреплена* одна сущность?
*что такое "закреплён", куда и как он "закреплён" мне не понятно.
По пирамиде Маслоу вниз можно скатываться не сразу на дно. Ну т.е. до ситуации, когда в доме нет отопления, воды, газа, электричества, окон и жильцов.
Поэтому могут быть ситуации, когда света нет по многу часов в сутки, но ещё есть окна и в целом, вдруг пронесёт.
Я к чему всё пытаюсь подвести. Человек длительно вырабатывает достаточно малую мощность. А наши электроприборы потребляют достаточно большую мощность. Поэтому павербанк зарядить конечно можно, но что с ним делать с этим одним павербанком? Заряжать фонарик в туалет ходить?
Как вы ставите в один ряд буржуйку и генератор? У вас электричество вырабатывается от сжигания топлива в печке? Так это менее эффективно, чем генератор.
Если вы говорите про то, что в случае апокалипсиса будет не до электричества, то можно посмотреть недавние истории штурмуемых городов. Там да, не до генераторов. Там печка для тепла и готовки еды.
С технической точки зрения это возможно.
С практической точки зрения, это очередной аналог трёхбуквенного решения. По своей сути инкапсуляция нужного трафика в какой-то незаметный трафик.
Как только это будет сколько-нибудь массово, это тут же встанет под контроль.
Я уж не говорю про то, что это решение требует дополнительных участников в иностранном цифровом пространстве. Этот второй модем должен же существовать там и мы ему должны деньги платить за его работу.
Т.е. это не побочная функция, которую мы внезапно придумали.
Охладите свой восторг. Это перевод статьи, а не авторская статья. Т.е. это не участник сообщества и он не ответит в комментариях на все вопросы.
P2P соединения внутри страны всё ещё возможны большим количеством способов.
А вот вывод трафика в иностранных провайдеров без фильтрации посередине затруднён.
Простите, я не могу удержаться.
Пожалуйста, прокомментируйте мой предыдущий тезис. Вы это называете статистикой, не перс.данными. Вы говорите, нельзя идентифицировать пользователя.
Я вам привожу верхнеуровневую методику идентификации на основе тех данных, которые вы сообщили.
Вы имеете:
IP без последнего октета
Разрешение экрана
Версию ОС
Локаль
Как я вам ранее говорил, провайдеры, как правило, отдают клиентам адреса с маской не более /16. Т.е. это 65534 хоста.
Т.е. у вас есть понимание, что это один из 65534 хостов конкретного провайдера.
Далее вы берёте доп.параметры и составляете достаточно уникальный отпечаток браузера.
Т.е. вероятность совпадения при таких вводных стремится к нулю IP 192.168.0.X, 1920x1080, Win10 22H2, ru_RU.UTF-8.
Конкретные числа могут варьироваться. Клиенты за NAT, поэтому каждый белый адрес это не 1 клиент, а десятки или сотни. Но мы же тоже оперируем только несколькими параметрами. А вы говорили, что знаете ещё что-то.
Мы вновь говорим об одном и том же. Я вновь процитирую своего собеседника из начала ветки обсуждения:
Ну тут же чётко, русским по белому написано - собираем кучу инфы для подсчёта количества активных версий.
И обезличиваем отбросом последнего октета IP.
Я же дальше в ветке развернул свою мысль, что по этим данным можно составить отпечаток браузера и создать уникальный ID. Что отброс октета не является обезличиваем, а лишь немного увеличивает группу подобных клиентов.
Я вам и всем читающим отчаянно пытаюсь доказать, что (далее цитаты ваших комментариев):
избыточны для
Я не думаю, что ваши коллеги и ваша компания не понимают этого. Компания достаточно успешна, значит там работают не глупые люди =)
Мало того, я вынужден признать, что и вы конкретно не зря едите свой хлеб. Ибо вы как хороший фокусник показываете одно, когда на самом деле есть другое.
И даже тогда, когда я вам показываю противоречия в ваших словах, вы не сдаётесь и невозмутимо продолжаете словесную акробатику.
Серьёзно, вы хорошо решаете задачу репутации бренда, даже с таким вредным и придирчивым оппонентом, как я.
В целом, мы достигли некой асимптоты в нашей дискуссии. Я вам указываю явные противоречия в ваших словах, привожу конкретные методики идентификации пользователей на основе той "статистики по количеству экземпляров браузера", которую вы собираете.
Вы мне беспринципно пытаетесь доказать, что вы не идентифицируется пользователей на основе этой статистики.
Поэтому считаю нашу дискуссию законченной. Успехов вам!
Мы тут с вами в трёх ветках обсуждаем, что браузер собирает данные исключительно для подсчёта количества. И именно вы лично это количество регулярно считаете.
А теперь вы откровенничаете, что это всё-таки не только количество, но и какая-то статистика популярности, нужная для разработки.
Ох, сколько открытий чудных нам ещё предстоит =)
Но вы знаете 3 октета IP адреса, вы знаете разрешение экрана, версию ОС, локаль (это к слову о стране) и "прочая стандартная статистика".
А мы и не ищем. Мы просто констатируем факты, опираясь на ваши слова. А далее я предлагаю варианты, как эти факты можно интерпретировать.
Я не говорю, что вы их так интерпретируете, нет. Но вы эти данные собираете и существует возможность эти данные именно так интерпретировать.
Ещё раз. Я говорил о том, что в абсолютно подавляющем количестве случаев, одной копией браузера пользуется один человек. Современные ОС многопользовательские, поэтому даже если комп один, то учёток две, копий браузера две. И идентифицируя браузер вы вполне идентифицируете человека.
Включаю логику на максимум своих небольших возможностей. Читаю ваш первый комментарий в ветке комментариев
Ещё раз и по частям.
Какое-то голословное утверждение. Вы для своей статистики собираете достаточно информации, чтобы идентифицировать.
Провайдера врядли выдают адреса на клиентов с префиксом более /16. Т.е. в одной подсети не более 65534 клиентских устройств. А то и того меньше. Выборка не очень большая, с учётом того, что это конкретный провайдер.
Далее вы собираете данные о разрешении экрана, версии ОС, языке. Есть ещё "прочая стандартная статистика", но мы же не знаем, что под этим подразумевается. Поэтому не будем использовать.
И вот теперь давайте прикинем. На основе IP без последнего октета мы знаем, что это один из 65534 клиентов. Далее мы сужаем выборку фильтруя через комбинацию разрешение экрана+версия ОС+язык. Даже если мы не дойдём до одного хоста, мы снизим количество до сотен, если не десятков хостов.
Лично вы считаете количество. А ваши коллеги считают что-то другое =)
И вы ловко проигнорировали самое главное. Зачем вам для простой статистики количества столько дополнительных данных? Ну и что, что сайты собирают это всё. Вашей компании зачем эти данные?
Как разрешение экрана, локаль и версия ОС поможет посчитать количество? Не провести некую комплексную аналитку, а именно посчитать количество, о котором мы тут говорим.
Так вы можете объяснить, зачем для подсчёта количества браузеров вы собираете столько информации о браузере?
Что будет, если вы будете собирать меньше этой информации?
Например, генерировать уникальный хеш при первом запуске. И единожды отправлять его на сервер. Тогда вам не нужны дополнительные факторы.
Вы убираете 0,00001% юзеров, которые пользуются двумя браузерами. И даже вы не их убираете, а только некую часть их цифрового отпечатка, который остаётся в другом браузере.
Давайте ещё раз и по частям.
Хотите я вам ещё цвет своих носков скажу для подсчёта "количества активных версий браузера"?
А вам он и не нужен, этот последний октет. Какая разница какой конкретно я из нескольких сотен клиентов (в зависимости от маски сети) моего провайдера? Вкупе с остальными отпечатками браузера и вашей "статистикой количества активных версий браузера" меня вполне можно идентифицировать.
Не деанонить, но идентифицировать. Деанонить можно потом, зная множество факторов.
Спасибо, конечно. Опен сорс это всегда хорошо. Но ведь вы не открываете алгоритмы обработки "статистики количества активных версий браузера", в которой "данные о разрешении экрана, версии ОС, языке и прочая стандартная статистика".
Вот с этим полностью согласен. Я тоже за авторитетные, честные и подкреплённые фактами мнения. И я против манипуляций из букваря манипуляций, ловкой словесной акробатики типа "вы платите столько же, но чаще" и прочих ухищрений для сокрытия истинных целей.
Мы ведь все тут за всё хорошее и против всего плохого, правда?
Да, выглядит вполне логично. "IP адрес" он же "адрес".
Стояла ли перед вами такая же задача, как стояла перед персонажем из статьи? Если стояла, как вы её решили?
Я тоже не специалист по приготовлению супов (вроде бы это называется повар). Но когда передо мной ставится задача приготовить суп я изучаю лучшие практики, читаю чужие советы, рекомендации, лезу в нейронку, в конце концов.
При этом я сохраняю скепсис понимая, что нейронка может мне посоветовать откровенный бред или даже что-то опасное.
Уважаемый суд не смутило, что один IP закреплён* за двумя агентствами недвижимости. Чтобы этот "IP" из себя не представлял, это нормально, что у двух разных организаций закреплена* одна сущность?
*что такое "закреплён", куда и как он "закреплён" мне не понятно.
За тем же, зачем этот древний ноутбук + потраченное на него время.
Я посмотрел ваш профиль и очень хочу спросить. Вы за зарплату комменты пишете на хабр или от чистого сердца?
По пирамиде Маслоу вниз можно скатываться не сразу на дно. Ну т.е. до ситуации, когда в доме нет отопления, воды, газа, электричества, окон и жильцов.
Поэтому могут быть ситуации, когда света нет по многу часов в сутки, но ещё есть окна и в целом, вдруг пронесёт.
Я к чему всё пытаюсь подвести. Человек длительно вырабатывает достаточно малую мощность. А наши электроприборы потребляют достаточно большую мощность. Поэтому павербанк зарядить конечно можно, но что с ним делать с этим одним павербанком?
Заряжать фонарик в туалет ходить?
Надо написать мечту петербуржцев - если дождь идёт уже более 7 дней, поставить солнечную погоду =)
Как вы ставите в один ряд буржуйку и генератор? У вас электричество вырабатывается от сжигания топлива в печке? Так это менее эффективно, чем генератор.
Если вы говорите про то, что в случае апокалипсиса будет не до электричества, то можно посмотреть недавние истории штурмуемых городов. Там да, не до генераторов. Там печка для тепла и готовки еды.
Идея оч.интересная! Но почему именно Питер? Можно и без плагина дождь на постоянной основе включить и будет очень похоже =)