Как стать автором
Обновить

Смартфон не прослушивает вас в фоновом режиме. Истина куда страшнее

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров44K
Всего голосов 57: ↑29 и ↓28+7
Комментарии126

Комментарии 126

даже домашнии аналоговые проводные прослушивали

В статье разбирается почему "прослушка" в формате сбора аудио-материала бессмысленна, и какие есть более продвинутые методы

Не вижу в статье информации, почему она "бессмысленна". Вижу только утверждения, что, "возможно, аудиопрослушка не ведется", на основании какого-то одного эксперимента

Потому что человеки примерно одинаковые и их можно на пару сотен категорий разделить и таргетно показывать рекламу, а ещё человеки очень предсказуемые. Нет смысла слушать блеяние каждой овцы в стаде.

Да, я тоже пришёл к такому выводу, правда, весьма умозрительно. Наверняка учитываются факторы, которые соцсети и так доступны: время, сколько юзернейм проводит в соцсети, какие страницы читает, местоположение и т.д. и т.п. А дальше вопрос чисто корреляций.

Почему собирать с вас телеметрию и ваше местоположение смысл имеет настолько, что все приложения в вашем телефоне этим занимаются (1, 2), а собирать ваши разговоры, хотя-бы переведенные в текст, чтоб место сэкономить, уже смысла и нет?

Потому, что собирать мета-данные проще, так как они весят меньше, чем аудио

Вот только в андроиде голосовой набор работает в авиарежиме.

Видимо от версии зависит. У меня не работает. Только, если в авиа подключиться к вайфаю.

Если мне память не изменяет, то в "Книге Перемен" утверждается, что в жизни существует всего 52 ситуации. И вроде было исследование, что сюжетов в литературе тоже всего несколько сотен.

64 гексаграммы и от 134 до 2500 архетипичных сказок в зависимости от глубины проработки классификатора.

А еще существуют 36 китайских стратагем, их вариация на тему "игры, в которые играют люди".

В литературе три.

О великой любви

О великом походе

Не помню :)

Прочитайте внимательнее: её легче заметить по расходу данных и нагрузке на процессор

Плюс тем, кто слушает потребуется хранилище в несколько петабайт

Плюс тем, кто слушает потребуется хранилище в несколько петабайт

Зачем? Кто в здравом уме, целенаправленно разрабатывающий и уже имея рабочий алгоритм распознавания аудио в текст будет хранить сырое аудио даже в низкобитрейтном кодеке? Распознали на лету в ТХТ и сохранили. 1 мегабайт ТХТ это тысячи страниц текста, который вы будете набалтывать неделями. А текст ещё и отфильтровать по токенам можно. Миф с нехваткой места специально раздувается для усыпления внимания людей.

Одна печатная страница на пишущей машинке это две тысячи знаков. Сл-но 1 мегабайт это пятьсот страниц.

Ну я условно-гипертрофировано. Тем не менее, нужно постараться, чтобы наговорить столько, чтобы полностью заполнить всё печатное пространство страницы без пустых строк и значительных пробелов. А диалоги вообще разряженые обычно, как в жизни так и в книгах.

Так текст просто прекрасно сжимается, зачем хранить сырые данные вместо пожатых gz/zstd/etc?

Я однажды совершенно случайно провел интересный "эксперимент". Была у меня Яндекс.Станция, купил по приколу. Поигрался с ней пару месяцев, да и надоела мне она. Но как блютус-колонка она оказалась очень даже ничего.

В итоге, включил я Алису в режиме блютуса, подрубил к ней ноут, и весь мой ютубчик с ноута играл на Алисе. Все было просто идеально.

Прошла неделя-две-месяц, и вот я у себя дома поменял роутер, а новые настройки вайфая Алисе не рассказал. Колонка оказалась в полном офлайне, только подключенная к ноуту по блютусу. Алиса продолжила воспроизводить звуки моего компа, но где-то через неделю (или даже пару дней, не помню) начала самопроизвольно отключаться полностью (так чтоб прям совсем гаснуть). Попробовал отключить из розетки и включить заново: в этом случае она включалась, загружалась, работала минут 15 нормально в режиме блютус-колонки - и снова отрубалась.

Ну все, сломалась, подумал я. А потом взял да и подключил ее к новому своему вайфаю - и вуаля! проблема исчезла. Снова все стало работать отлично, без внезапных отключений.

Через какое-то время повторил "эксперимент" в точности - и проблема опять воспроизвелась. И опять решилась путем подключения колонки к интернету.

То есть алгоритм такой:

  • Отключаем колонку от интернета;

  • Пользуемся колонкой неделю (+/-) в режиме блютуса, то есть колонка постоянно включена, но не имеет доступа в интернет;

  • Через неделю колонка без предупреждения полностью отключается, временно превращается в "кирпич";

  • Отключаем блок питания, включаем заново;

  • Колонка включается;

  • Далее при каждом включении работает не более 15 минут, через 15 минут отключается снова;

  • Если включить ее опять и успеть скинуть настройки вайфая - все сразу становится хорошо.

Какая причина такого поведения напрашивается? Ну конечно же, - у колонки есть определенный буфер для записанных с микрофона данных. Когда колонка в сети - она периодически скидывает этот буфер в облако, освобождая место. А когда интернет пропал, то буфер переполняется, и разработчики Алисы не подумали что какой-то идиот будет держать колонку долго в оффлайне - и вот вам баг, который (возможно) спалил нехорошее поведение.

Прочитайте внимательнее: её легче заметить по расходу данных и нагрузке на процессор

Под "смыслом" каких-то действий обычно подразумевают профит, а не наличие/отсутствие возможности совершать эти действия незаметно.

Профит от этого очевиден. А возможность делать это, оставаясь незамеченным, - сильно зависит от каждой конкретной реализации данной задачи. Завтра какой-нибудь Эппл запилит новую версию силикон-процессора (если уже не), в котором например будет скрытое ядро, не отображаемое ни в каких утилитах мониторинга, - и вот вам прослушка которую не заметили.

Ключевое слово "домашнии" . Пацан зарегистрировался меньше суток назад (из Пикаба?) и на 53 комментария сумма плюсиков = 0

Ну вот про скриншоты пример - сказано что скриншоты себя же и даже иногда видео (насколько помню кстати Amplitude что-то похожее может). Но тогда это не такая угроза - данные которые приложение отображает - и так ему доступны (ну кроме особых случаев с DRM-контентом). Вот если бы посторонних приложений скриншоты реально делались.

Себя - это расплывчато сказано. Может, экрана с активным собой? Но там хватает инфы в статусе и всплывающих уведомлениях.

Устройство с голосовым управлением включается на мгновение, как только локально обнаруживает ключевую команду

Вот только для того, чтобы обнаружить ту самую голосовую команду, микрофон должен быть постоянно включен и абсолютно все звуки, которые ловит этот микрофон, должны анализироваться. Понятно, что вычленить из всего фона простую команду типа "окей гугл" можно с помощью достаточно грубого анализа, не углубляясь в смысл разговора и даже не транскрибируя его. Вот только никто не знает точно, на какие ещё команды может тригериться этот помощник.

Но самое стрёмное - это не фэйсбуки с гуглами, а всякие новомодные онлайн-защитники от мошенничества, предлагаемые мобильными операторами. Вот там реально идёт глубокий анализ разговора с транскрипцией. И то, что одна государственная или т.н. "афиллированная с государством" компания по заказу другой подобной компании может собрать, проанализировать и передать ей какие угодно данные, не вызывает никаких сомнений.

Есть ещё более стремное, когда целые датацентры с большим количеством специально обученных миньонов целенаправленно работают на ниве выкачивания денег самыми изощренными методами

Вы имеете в виду телефонных мошенников или маркетологов, которые своей следящей рекламой заставляют домохозяек покупать всякий пластмассовый хлам на маркетплейсах?

А есть принципиальная разница?

Разница только в том, что этот сервис заменяет одних другими

это не принципиальная разница

Самое веселое в этих "защитниках" - полномочия на запрет соединения.

То есть эта посторонняя штука решает - кто кому может позвонить, а кто нет. Что открывает потенциально огромный простор для всякого.

Контролируется (включая какие-никакие настройки и отключение) пользователем.

По сути оно ж бывает двух типов - локальное приложение (без доступа к аудио звонка - чисто по номеру) - спамблокеры вроде Whocalls и куча их и сетевой анализатор когда сеть решает что делать (Тиньковская Оля и ее дополнения). Ну и гибриды (Ева мегафонская?, у которой часть функционала без приложения не работает).

Пока контролируемое.

И вот вспоминаешь про недавнее обсуждение что надо бы запретить по умолчанию звонки с иностранных номеров и видишь внезапно у билайна услугу такую (бесплатну), у WhoCalls галочку про эту блокировку.

И жалобы что человек купил новый номер и не может дозвонится...ждем закон про реестр номеров подлежащих исключению из средств блокировки в связи со сменой владельца (а заодно - и с централизованным добавлением туда номеров мошенников и иноагентов)? :)

Они даже не шифруются и внедряют целые ии сопроцессоры для распознавания голоса. Ну а для прослушивания для таргетирования нужно вычленять только ключевые фразы или слова. Делать это могут сами производители смартов и уже затем продавать или обменивать инфу на биржах. Все указанные в статье эксперементы выглядят весьма дилетанскими.

Эксперимент конечно шикарный.

"Мы дали телефону послушать рекламу, а он не выдал такую же рекламу, значит ничего не слышит"

Похоже на "Майский жук слышит ногами".

Однажды, играя в League of Legends очередной матч, после череды поражений, я написал что они (Riot Games) похоже хотят чтобы я "hang myself on a rope".... Немногим позже моя лента в ютубе была буквально завалена разными видео на тему суицида :D

И телефона рядом, конечно, не было?)

Телефон не при чём -- у меня складывается впечатление, будто Microsoft с Гуглом обмениваются телеметрией, не зря же один из бывших сотрудников MS касаемо темы Windows 11 говорил что "you are a product, not Windows 11".

А в плане рекомендаций Ютуба -- были видео на тему как бороться с мыслями о суициде, о том почему мужчины делают такой выбор и т.д.

По сути, Win 11 промониторила ввод с клавиатуры и передала дальше по цепочке, ну, по крайней мере так кажется.

Не думаю, что сами ms и google. Скорее в приложения зашиты sdk компаний, собирающих данные для рекламщиков. На андройде это именно так реализовано. И вот тут в статье сказано, мол "не будут микрофон держать включенным"... Но некоторые приложения имеют доступ к микрофону (всякие рекордеры, мессенджеры и т д) и ничто не мешает sdk в их составе делать две вещи: делать запись эпизодически либо искать ключевое слово из списка. Само приложение и его автор может об этом даже не подозревать (особенно,если sdk явно не требует запрос доступа к микрофону, а просто смотрит если он есть - включаем модуль анализа. И получается искать надо в таких приложениях, где он есть. Особенно в играх и в тех, кто в потенциале может в фоне работать)

Как уже говорили, сейчас в каждом смартфоне есть либо dsp, либо ии сопроцессор/ядро. Потребление ресурсов основного процессора на распознавание аудио будет минимальным. (Тем более что линукс, коим является андроид далеко не всегда адекватно показывает загрузку cpu. В экспериментах нужно смотреть на расход батареи) .

Единственное что противоречит этой "теории заговора" - это отсутствие найденных "жуков". Но так судя по всему этим не очень много людей занято. С учетом того, что только вот недавно один человек более приземленной вещью озадачился - а куда эти рекламные sdk шлют данные и какие? (Был на хабре буквально пару дней назад перевод статьи. Там как раз подопытной была игра на платформе юнити )

у меня складывается впечатление, будто Microsoft с Гуглом обмениваются телеметрией

Крупные все в той или иной мере сотрудничают в этой сфере. При чем со времён еще до повления смартфонов.

А что конкретно рекламировалось? Будки самоубийств?

Клуб самоубийц, как в кино... )

КДПВ просто антибомба

Текст, впрочем, такой же. Одно утверждение, что юзеры знали, что ФБ их проверяет и слушает... Автор сам EULA читал, там среди миллиона пунктов очень много чуши

Блин, а можно выбрать в причине минуса “захлебнулся в воде, пока читал статью”?

Краткое содержание статьи на русском языке:

Статья развенчивает распространённый миф о том, что Facebook и другие технологические компании тайно записывают разговоры пользователей через микрофоны смартфонов для показа целевой рекламы. Хотя многие люди сталкивались с ситуациями, когда реклама удивительно точно соответствовала их недавним беседам, доказательств постоянного прослушивания микрофонов не найдено. Эксперименты, проведенные компанией Wandera в 2019 году, показали, что постоянная передача аудиоданных потребляла бы огромные объемы трафика, что легко обнаружить, но таких данных не было зафиксировано.

В 2024 году появилась информация о системе Active Listening от Cox Media Group, которая якобы использовала голосовые данные для таргетинга рекламы. Однако крупные технологические компании, включая Google и Meta, быстро дистанцировались от этого проекта, а CMG заявила о его прекращении. Система, скорее всего, использовала только короткие фрагменты голоса, активируемые командами вроде "Hey Google" или "Hey Siri", а не записывала разговоры круглосуточно.

Исследования, проведенные в Northeastern University, также не обнаружили доказательств скрытого прослушивания, но выявили другие тревожные методы сбора данных, такие как автоматические скриншоты и видеозаписи экрана, передаваемые третьим сторонам. Эти данные, наряду с информацией о местоположении, покупках, социальных связях и поведении в сети, позволяют алгоритмам с высокой точностью предугадывать интересы пользователей и показывать релевантную рекламу.

Главный вывод статьи: компании вроде Facebook не нуждаются в прослушивании разговоров, так как уже обладают огромным количеством данных о пользователях, которые анализируются сложными алгоритмами. Это делает таргетированную рекламу настолько точной, что создается иллюзия, будто компании "подслушивают" частные беседы. Реальность же оказывается сложнее и тревожнее простых теорий заговора.

Вот уж чего не надо, так это LLM-суммаризации. Это еще хуже, чем водянистая статья.

у меня ощущение, что статья тоже писалась с помощью LLM

И комментарии тоже написаны LLM.

Ну не надо, так не надо )
Мне сэкономило немного времени, тем более что вся "вода" вероятно тоже от LLM.

Еще более краткое содержание статьи:

Тревожно.

Мне нравится, дайте два

Офигеть, ещё и минусов накидали )
В статье тонна воды, наверняка сгенерённая LLM. Дай, думаю, сделаю укороченную версию, закину в комментарии, сэкономлю время себе и другим.

Удалил бы, да уже нельзя.

Русский у вас родной ? У меня и жены да, и укороченная версия без воды - это не то, что вы сделали....

Tdrl в целом следующий:

Все отмазываются от того, что постоянно слушают разговоры приводя при этом различные очень подозрительные и малосостоятельные аргументы и опыты.

Т.е. скорее всего всё-таки слушают :).

ЗЫ. А ведь так просто было бы сделать телефон, который аппаратно не включает микрофон без механически нажатой пользователем кнопки. Но его нет :).

Да слушают, слушают. Эпл изобретает нечеловечески красивый способ не передавать персональные данные для распозхнавания "Эй, Сири", а приложения вроде тех, что от Яндекса, работают, как думается, всё же, наоборот - стучат-с!

А что в статье написано, причем написано как обобщение двух-трех исследований британских ученых на деньги грантов - и написано с припиской, что "правда еще страшнее" - это может сойти за частное мнение автора текста (промпта, отправленного в GPT), но только факт говорят обратное.

Условно, когда я обсудил со знакомым его, знакомого, рыбалку, и через 20 минут начинаю видеть баннеры про удочки - это уже не подозрение, это уверенность!

Ты с другом обсудил гольф и вот фейсбук тебе показывает клюшки. Ты думаешь, что это была прослушка. На самом деле, твой друг после разговора погуглил правила гольфа. А друзья вы не только в реале, но и в фейсбуке. Или даже проще - начали вы говорить про гольф "ни с того ни с сего" после того как Ваш общий друг в фейсбуке что-то про гольф зашерил. Свобода воли - это иллюзия.

я оставил смарт дома и сходил далеко (сотни тел между точками) к чуваку у которго смарт в mts2g/only (без wifi но edge) да при нём разговаривали про всякое да что один чел сказал что другой дом тогда за млн построил - мы никак на уровне контактов/звонков/im/соцок/gps не связаны а симки (у него на сестру которая за 250+ км живёт с другой фамилией а у меня на мёртвого деда третьей фамилии да смарт по его адресу прописки только обитал не выходя никуда: у меня максимально-возможное на вьетнамце приваси да я молчу при смарте (да никуда с него голосом) и разговариваю негромко в дальней комнате за двумя плотными дверями с кучей преград между ними): прихожу домой и выведя смарт из airplane в incognito (и без профиля гугла) ютубе мне первое видео про то как построить дом дешевле млн руб ... я был готов к такому тк у соседа если про что-нибудь говоришь и вдруг решил в его смарте что-то глянуть да уточнить ещё несмотренное - в строке поиска яндекс уже предлагается вопрос который хотел бы спросить: у чела спрашиваешь смотрел ли он или телек про эти темы или говорил про это ранее - он отвечает что нет да что ты сам эту тему начал (а я с одного-направленного эфира зацепил и переподумав создал в голове отдельный thread который вспомнив озвучил в не своего смарта) ... поэтому был готов что на ближайшем смарте будет реакция но не готов что голос&imei связки есть для персонализации неперсонализированного терминала aosp независимо в какой imei&location ты подал причину - тупо по голосу (как в фантастиках где по сказаному где-либо слову (из двух букв) сразу находят/gps чела) понял (2g) где я и дал ответ не туда где меня нет а туда где я опять хотя молчал при терминале

Где, мать его, запятые.

Что вы не зуммер, а незатейливый идиот - это мы сразу поняли. Но наличие хоть какого-то смысла в излитом потоке сознания до сих пор остаётся загадкой для человечества.

Кинул текстовку выше в DeepSeek R1. Машина оказалась терпеливее меня, вот итог:

Автор поста выражает подозрение, что смартфоны или приложения тайно подслушивают разговоры, даже в условиях, когда это технически кажется невозможным. Он приводит примеры:

  1. После обсуждения дорогого дома с человеком, чей телефон был на 2G (без Wi-Fi), в его собственном смартфоне (в режиме инкогнито, без аккаунта) появилось видео о строительстве дома за миллион.

  2. У соседа в поисковой строке возникали вопросы, которые он хотел задать, хотя сосед отрицал поиск по этой теме.

Его выводы:

  • Системы якобы умеют идентифицировать пользователя по голосу, связывать его с IMEI/местоположением, даже если нет явной привязки через соцсети, GPS или SIM.

  • Персонализация контента работает «как в фантастике» — будто ключевые слова из разговоров автоматически запускают таргетинг, минуя настройки приватности.

Суть: Автор убеждён, что телефоны скрыто анализируют речь и используют её для рекламы/контента, несмотря на меры защиты (анонимные SIM, режим полёта, физическое расстояние от устройства). Это вызывает у него тревогу о тотальной слежке через гаджеты.

Пора Хабру не за пустой контент платить, а через GPT суть комментов "проявлять" - это точно будет востребовано (шутка)!

Прочитал два раза. А можно перевод на русский?

Вслух не читайте, я так демона вызвал.

Возможно, вы не настолько изолированы, как вы думаете, или вам просто повезло. Согласитесь, недорогие дома это достаточно популярный товар, это не экзотика типа 3д принтеров или доильных аппаратов, такая реклама может откручиваться всем.

Но подобный стрим данных провоцировал бы нагрузку на процессор смартфона, и она была бы сразу заметна — её практически невозможно скрыть.

Но это же так и есть, куда уж незаметнее. Приложение Facebook всегда находится в топе статистики энергопотребления, даже когда не пользуешься приложением.

Даже выше ютуба? Хотя, смотря кто чем пользуется

А если распознавать голос в процессе разговора, переводить в текст, и отправлять на сервер текст. Анализ скриншотов, и запросов в интернет (всё посещаемые сайты). Анализ ввода через клавиатуру смартфона. Анализ местоположения по координатам сотовых вышек. Анализ частоты вызовов и сопоставление интересов контактов. Анализ статистики расположения смартфонов рядом. Анализ всех фото и файлов в смартфоне. Анализ активности использования по времени суток и другая статистика. Даже анализ установленной системы (даже если всё данные стерли и начисто установили другую систему, всё равно производитель узнаёт).

Всё в совокупности анализов, выдаст всю информацию, о человеке. Где, когда, что его интересует, где работает, какие взгляды и т. д.

«Не для себя интересуюсь, для друга»...

Если соединить ещё всё это с общедоступной информацией, то вообще бомба. Например, юзер провёл в таком-то месте 2 часа, в этом же месте и в это же время проходило мероприятие на такую-то тему. И неважно, что пользователь мог быть там в качестве гардеробщика, это статпогрешность. Главное угадать для основной части пользователей.

На эту тему есть отличный сериал "В поле зрения". Там подобная машина предсказывала вероятность преступлений

Биг дата вполне успешно работает в Китае, и наверняка может предсказывать часть преступлений... прост для верхушки власти её отключили вроде ))) чтоб сами на себя при расследовании не выходили 😁😁🤣

Нет, там не вероятность, а именно само преступление, чисто deus ex machine. А чтобы это не казалось примитивным - у машины есть свой "закон робототехники" - и она говорит только номер соцстрахования жертвы (или убийцы). Несмотря на такой очевидный рояль в кустах, сериал очень неплохой, причем и с точки зрения научной фантастики, и технологий и рассуждения на тему ии. А ещё там направленной антенной взламывают блютузы, чтоб прослушивать противников

И несмотря на то, что уже с десяток лет прошло с окончания сериала, он во многом ещё выглядит актуальным/свежим/не сильно устаревшим.

А если распознавать голос в процессе разговора, переводить в текст, и отправлять на сервер текст.

Скорее не сам текст, а его "теги".

Лучше текст, его не так много, а интерпретация может меняться по мере совершенствования модели. Лучше не терять первоисточник по возможности.

Можно удалить все, кроме 6-7-8 абзацев с конца

С одним человеком как-то по телефону обсуждали тему, там был упомянут один инструмент, через пару дней мне в интернете пошла реклама этого инструмента. С человеком ни в каких соцсетях не состоим в друзьях, только его номер телефона. Никогда про этот инструмент не интересовался и вообще далек от всего этого. При этом всякие голосовые команды для приложений в телефоне у меня заблочены на системном уровне. Как и разрешения и доступв к разным категориям для приложений все всегда отключаю, запрещая работу в фоне, кроме интернета.

Если оба устройства в одной вай-фай сети, то этого уже немало для анализа)

Вайфаем не пользуюсь, вообще не включаю, а в телефоне отключена функция volte🤷‍♂️

У человека может быть ваш номер в контактах и доступ приложений к ним.

Что значит "может"? У 99% установлен сбербанк онлайн еще с тех времен, конда он требовал доступа к телефонной книге...

Если проприетарное ПО на "наших" девайсах нас не слушает то как возможно это видео?

https://www.youtube.com/watch?v=zBnDWSvaQ1I

Чел выбрал случайную тему, сообщил её по зрительному каналу, показал свой браузер без адблока, немножко поговорил на выбранную тему так чтобы компьютер точно услышал, и зашёл на те же сайты что до разговора. Все сайты стали показывать рекламу на выбранную тему. Шах и мат людям которым "нечего скрывать".

Видео как раз создать не трудно. Видео (на плёнке) ещё 100 лет назад делали с любыми эффектами. Надо проверять самому, только тогда можно что-то сказать, увы.

С первой частью сообщения согласен, даже не подумал что у настолько шпионящей ОС могут быть пропоненты. Ну правда, может быть у него на лаптопе несколько виртуалок с переключением педалькой.

Со второй частью не согласен - нет и не может быть протокола проверки. Если даже automotive индустрия обманывает весь мир с использованием компюьтера, то что мешает вендору зафольксвагенить того кто будет проверять самому? А может вообще просто драйвер микрофона заглючит из-за неправильной погоды на Юпитере и будет сделан вывод что шпионажа нет.

Да, протокола нет. Но можно воспроизвести процедуру автора и... сообщить, что таки да, всё произошло так же или похоже. Или - нет, ничего похожего достичь не удалось. В принципе, это нормальный ход научного исследования. Кто-то делает опыт и полностью его описывает в печати. Другие (учёные) его читают и пытаются по описанию воспроизвести. И результат тоже печатают. Так и живут)))

Читал несколько лет назад интервью бывшего программиста Фейсбука, он говорил что при помощи анализа частотности слов, данных о местоположении и датчика положения аппарата они могли не то что предпочтения для покупок делать и давать нужную контекстную рекламу но даже и знать о болезнях пользователя, о которых ещё не знает и сам владелец телефона. Например легко определялась беременность по изменению походки, заболевания суставов и позвоночника и прочее. Наверное с тех времён прогресс шагнул дальше

Был же громкий скандал, когда сеть магазинов Target предложила товары для молодых мамочек школьнице старших классов. Батя там пошёл в разнос, но выяснилось, что на основе деятельности дочери алгоритм всё верно предположил и батя стал счастливым дедом. Подробнее тут: https://habr.com/ru/articles/147284/

У меня как-то утром заболело колено. Я не гуглил и не говорил про это. Молча еду на маршрутке и на смартфоне выходит реклама "Болят колени? Мазь такая-то". Я прям офигел... Наверно просто совпадение, но было стремно.

Телефон прикладывали к колену? NFC сенсор умеет сканировать как МРТ! /s

Ещё не стоит сбрасывать со счетов эффект Баадера-Майнхофа.

Может реклама мази и так присутствовала в вашем окружении, но баннерная слепота уверенно ее не замечала. А как только что-то заболело, вы сразу обратили внимание.

Когда захотите купить, например, уазик, окажется, что на улицах одни уазики ездят ))

Бывает) Я как-то купил якобы редкий автомобиль в наших краях, но потом начал везде их замечать)

Такая же фигня. Оказалось, что в нашем дворе паркуется аж 6 "французов" считая меня. А были одни немцы да японцы. И город наполнился ПЫжами. Так и до паранойи недалеко )))

Возможно, это одна из самых распространенных и древних теорий заговора в области технологий. Дескать, смартфон постоянно прослушивает всё, о чем вы говорите. И наверняка вы сталкивались с ситуацией, когда общаешься с другом о необходимости купить шуруповёрт и через час видишь актуальную рекламу на платформе социальных сетей.

Мы не фиксируем, не замечаем, не осознаём тысячи несовпадений, зато всего одно совпадение из тысячи может сильно нас взбудоражить. Так уж устроен наш мозг - постоянно выискивает связи и паттерны.

В темах про прослушку телефона постоянно всплывает: "я сказал это, а на следующий день вылезло то". Ну давай проведём эксперимент. Возьми 10 телефонов (чтобы увеличить шансы, если "прослушка" идёт не постоянно а включается периодически, по рандому) и будем громко говорить о том, как же хочется пиццы.

Тут для проверки надо что-то неожиданное. Мне кажется, если профили пользователей "молодой, гуглит айтишные темы, устанавливал приложения пиццерий и суши маркетов" соберутся в одном месте, высока вероятность, что он рекламу еды на "посидеть с коллегами вечерком" засунет в контекст безо всякой прослушки, просто потому что ну а что ещё такие люди покупают, собравшись вместе. Ну кроме классики " ̶ж̶е̶н̶щ̶и̶н̶ы̶/̶л̶о̶ш̶а̶д̶и̶/̶к̶а̶р̶т̶ы̶ машины/работа /отпуск.

Наличие прослушки - это нулевая гипотеза, ибо смартфоны технически вполне могут это делать. Доказывать надо отсутствие этой самой прослушки. А поскольку доказательство отсутствия методически очень сложно, то на практике оно не выполнимо. Следовательно можно считать, что прослушка всегда есть и обходиться со смартфоном так, как если бы это был товарищ майор.

карманный товарищ майор, ага

Как бы это не звучало.

А что тогда - Алиса?

И меняется ли что-то если смартфон - с iOS (более жесткая политика в отношении фоновых штук) или GrapheneOS (с правами для посторонних приложений все очень жестко, Play Services вообщем то тоже касается)

Прослушанный данные не обязательно отправлять сразу. Можно, например, сохранять в памяти, а отправлять тогда, когда пользователь использует интернет. На фоне потребления трафика тем же браузером, 25Мб часовой записи голоса будут незаметны.

ну да, а можно и сразу же анализировать

используя ресурсы того же смартфона

и отправлять уже в сухом остатке целевую информацию

Тогда это было бы заметно в тесте как нерасчетная трата ресурсов.

У меня телефон индексирует фотографии только когда стоит на зарядке.

не зря же NPU во все новые процы суют

Насчет потребления данных и нагрузки на процессор - в телефонах есть отдельный процессорчик/DSP, который умеет ждать и распознавать hey siri и ok google. Потребляет он копейки, и будит основной процессор только в нужное время.

Кто мешает поручить ему "слушать" еще пару сотен (или тысячу) задаваемых заранее ключевых слов, а при просыпании основного процессора попутно с остальными данными отправлять хозяину устройства еще и блобчик с отмеченными словами, прозвучавшими за прошедшее время. Это будут даже не килобайты, а сотни байт данных.

Причем ключевые слова можно выставлять в зависимости от категории пользователя устройства - возраста, пола, места проживания. Уххх, понесло...

а это аппаратный ресурс? т.е. отдельный маленький чип для прослушки?

ну точно, маленький товарищ майорчик

Часто это часть SoC, но не обязательно.

Но логически - отдельный процессор.

Вспоминается статья Яндекса https://habr.com/ru/companies/yandex/articles/431998/ там есть небольшой раздел как они решали проблему чтобы Алиса пользователя слушала без активации основного процессора.

но надо его учить еще и русскому и китайскому и суахили

Русский, китайский, суахили - он про это не знает. Фонемы, форманты, обертоны. :)

Необязательно слушать каждый конкретный разговор.

По звуку можно собрать огромное количество информации о пациенте в копилочку биг-даты.

Половозрастной состав семьи, животные, любимая музыка и телеканалы, половая активность, храп, здоровье.

Если орать "большие сиськи" или "увеличить писюн", то не работает )))

Потому что этот тип рекламы идёт по дефолту, ага.

лучший ;)))))

Надо кричать что-то одно. Маркетологи давно поняли что обе услуги враз не имеют платежеспособного спроса )

всё понятно кроме одного :( почему же всё-таки не ведётся прослушки (как утверждается)? технически это крайне возможно. Было бы глупо отказываться от предоставленных возможностей

После того, как поставил AdGuard, проблема прослушки меня не волнует (сарказм)

"ставь лайк если тобой невозможно манипулировать" :)

Скорости беспроводных технологий всё растут, это позволит маскировать трафик пересылаемых медиа-материалов. А любой мониторинг из функционала самого телефона будет показывать то, что нужно, а не по факту. Для получения объективных данных о трафике нужно прогонять его через имитатор базовых станций с DPI-опцией и генератором GPS-сигнала, например R&S CMW500 + R&S SMBV100A.

С DPI...проблема в том, что установку не-штатных Root CA поддерживают ой не все.

При попытке включить на уровне сети MITM (для хороших с моей точки зрения целей - роутер мой ж) - куча всего ложится (яндекс станция, лампочки всякие и прочее) и либо прописывать исключения либо не работает, ах да - прописать исключения только по IP-адресам устройств, лезут они куда попало.

С мобильным трафиком - сертификат то поставить можно но тоже очень весело, глюки в произвольных местах (в ВКВидео(именно видео а не сам ВК) например) + там и на уровне системы новые грабли добавляются если ставить в системное хранилище: https://httptoolkit.com/blog/android-14-breaks-system-certificate-installation/ (правда обходится - https://httptoolkit.com/blog/android-14-install-system-ca-certificate/ ) и на уровне Chrome - https://httptoolkit.com/blog/chrome-android-certificate-transparency/ (сделано хитро - если сертификат в системном хранилище - должны выполнятся все требования для публичных сертификатов включая CT-логи, а если в пользовательском - приложение может прикрыть)

Разве не достаточно сведений об объёме исходящего трафика и IP назначения?

Для мониторинга шпионажа со стороны колонки? Так там голосовое распознование почти все на серверах. Ставим триггер на сработку кроме "Алиса","Яндекс" еще и на "Путин","бомба" и сливаем а потом говорим что ошибка в настройках.

Ставим триггер на сработку кроме "Алиса","Яндекс" еще и на "Путин","бомба" и сливаем а потом говорим что ошибка в настройках.

А будет ложным срабатывание на чьё-то восхищение, звучащее как "Путин - бомба!"?

Личный пример. Instagram мне уже несколько месяцев настойчиво рекомендует подписаться на пару аккаунтов людей, связь с которыми осуществлялась только в Telegram и только в рамках личных диалогов/приватных чатов - больше нигде. Никакие контакты не создавались и нигде не сохранялись, включая сам телеграм. Никнеймы схожие, но не один в один (хотя профили точно принадлежат тем же людям). Мне это очень не нравится. Даже если не было никакого доступа к микрофону, такой уровень доступа к информации нисхера это очень плохо.

У меня был очень критичный случай на счёт прослушки. Так вот ко мне приехал брат и мы с ним в моей комнате говорили и он показал свой телефон и сказал что купил его на алиэкспрессе. А всё дело происходило перед компьютером и у брата и у меня телефоны на андроиде были. Так вот когда я сел за компьютер и стал что то искать и открывать сайты то выскочила реклама как раз купить тот телефон той марки и модели .. Я очень удивился поскольку не делал перед этим каких либо запросов по поиску телефона и как раз в тот момент у меня и появилась причина предполагать что телефоны прослушивают нас. Как ИТ специалист и специалист в области автоматизации и программист в курсе как это сделать, тут в комментариях явные ошибочные суждения пишут. Так вот всё проще, сначала распознаются слова, потом применяется частотный словарь, часть неопределённого просто посылается текстом в сжатом виде с хэшем частотного словаря и при этом трафик не отследить потому что можно передавать в определённые окна активности других приложений, выглядит это как ни с странно как поисковый запрос с метаданными. Система распознаёт метаданные и определяет наличие объектов и индексирует ситуацию. Сама система андроид банально определяет по системе поиска телефона других пользователей и вуаля. В общем схема выглядит по итогу так, на телефоне моего брата приложение прослушало, сделало запрос, гугл определил меня как ещё пользователя, AdSense уже приготовил рекламные шаблоны для моих точек входа в систему рекламы и по итогу я увидел рекламу телефона о котором говорил мой брат. По итогу обсуждение телефона заняло порядка 4 минут, а через 7 минут после начала обсуждения я уже увидел рекламу телефона о котором говорили. По факту нет классической прослушки просто есть слежка и передача метаданных частотного словаря и нераспознанных данных. По этой причине банально невозможно это как то обнаружить, поскольку нужно присутствие хотя бы пары пользователей и обсуждения между ними .. занавес

А самый прикол в том, что в 99,999% случаев люди говорят о том, что уже купили. И реклама не работает. Это как реклама на основе поиска. Искал, купил, + месяц эхо в виде рекламы уже купленного.

Обсуждали с другом по телефону мою предстоящую поездку в Болгарию, и зашла речь про девушек из Болгарии. Вскоре я созерцал рекламу шлифовальных машинок ака болгарки.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации