Как стать автором
Обновить

Смартфон не прослушивает вас в фоновом режиме. Истина куда страшнее

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров35K
Всего голосов 48: ↑21 и ↓27-3
Комментарии107

Комментарии 107

даже домашнии аналоговые проводные прослушивали

В статье разбирается почему "прослушка" в формате сбора аудио-материала бессмысленна, и какие есть более продвинутые методы

Не вижу в статье информации, почему она "бессмысленна". Вижу только утверждения, что, "возможно, аудиопрослушка не ведется", на основании какого-то одного эксперимента

Потому что человеки примерно одинаковые и их можно на пару сотен категорий разделить и таргетно показывать рекламу, а ещё человеки очень предсказуемые. Нет смысла слушать блеяние каждой овцы в стаде.

Да, я тоже пришёл к такому выводу, правда, весьма умозрительно. Наверняка учитываются факторы, которые соцсети и так доступны: время, сколько юзернейм проводит в соцсети, какие страницы читает, местоположение и т.д. и т.п. А дальше вопрос чисто корреляций.

Почему собирать с вас телеметрию и ваше местоположение смысл имеет настолько, что все приложения в вашем телефоне этим занимаются (1, 2), а собирать ваши разговоры, хотя-бы переведенные в текст, чтоб место сэкономить, уже смысла и нет?

Потому, что собирать мета-данные проще, так как они весят меньше, чем аудио

Вот только в андроиде голосовой набор работает в авиарежиме.

Видимо от версии зависит. У меня не работает. Только, если в авиа подключиться к вайфаю.

Если мне память не изменяет, то в "Книге Перемен" утверждается, что в жизни существует всего 52 ситуации. И вроде было исследование, что сюжетов в литературе тоже всего несколько сотен.

64 гексаграммы и от 134 до 2500 архетипичных сказок в зависимости от глубины проработки классификатора.

А еще существуют 36 китайских стратагем, их вариация на тему "игры, в которые играют люди".

В литературе три.

О великой любви

О великом походе

Не помню :)

Прочитайте внимательнее: её легче заметить по расходу данных и нагрузке на процессор

Плюс тем, кто слушает потребуется хранилище в несколько петабайт

Плюс тем, кто слушает потребуется хранилище в несколько петабайт

Зачем? Кто в здравом уме, целенаправленно разрабатывающий и уже имея рабочий алгоритм распознавания аудио в текст будет хранить сырое аудио даже в низкобитрейтном кодеке? Распознали на лету в ТХТ и сохранили. 1 мегабайт ТХТ это тысячи страниц текста, который вы будете набалтывать неделями. А текст ещё и отфильтровать по токенам можно. Миф с нехваткой места специально раздувается для усыпления внимания людей.

Одна печатная страница на пишущей машинке это две тысячи знаков. Сл-но 1 мегабайт это пятьсот страниц.

Ну я условно-гипертрофировано. Тем не менее, нужно постараться, чтобы наговорить столько, чтобы полностью заполнить всё печатное пространство страницы без пустых строк и значительных пробелов. А диалоги вообще разряженые обычно, как в жизни так и в книгах.

Так текст просто прекрасно сжимается, зачем хранить сырые данные вместо пожатых gz/zstd/etc?

Ключевое слово "домашнии" . Пацан зарегистрировался меньше суток назад (из Пикаба?) и на 53 комментария сумма плюсиков = 0

Ну вот про скриншоты пример - сказано что скриншоты себя же и даже иногда видео (насколько помню кстати Amplitude что-то похожее может). Но тогда это не такая угроза - данные которые приложение отображает - и так ему доступны (ну кроме особых случаев с DRM-контентом). Вот если бы посторонних приложений скриншоты реально делались.

Себя - это расплывчато сказано. Может, экрана с активным собой? Но там хватает инфы в статусе и всплывающих уведомлениях.

Устройство с голосовым управлением включается на мгновение, как только локально обнаруживает ключевую команду

Вот только для того, чтобы обнаружить ту самую голосовую команду, микрофон должен быть постоянно включен и абсолютно все звуки, которые ловит этот микрофон, должны анализироваться. Понятно, что вычленить из всего фона простую команду типа "окей гугл" можно с помощью достаточно грубого анализа, не углубляясь в смысл разговора и даже не транскрибируя его. Вот только никто не знает точно, на какие ещё команды может тригериться этот помощник.

Но самое стрёмное - это не фэйсбуки с гуглами, а всякие новомодные онлайн-защитники от мошенничества, предлагаемые мобильными операторами. Вот там реально идёт глубокий анализ разговора с транскрипцией. И то, что одна государственная или т.н. "афиллированная с государством" компания по заказу другой подобной компании может собрать, проанализировать и передать ей какие угодно данные, не вызывает никаких сомнений.

Есть ещё более стремное, когда целые датацентры с большим количеством специально обученных миньонов целенаправленно работают на ниве выкачивания денег самыми изощренными методами

Вы имеете в виду телефонных мошенников или маркетологов, которые своей следящей рекламой заставляют домохозяек покупать всякий пластмассовый хлам на маркетплейсах?

А есть принципиальная разница?

Разница только в том, что этот сервис заменяет одних другими

это не принципиальная разница

Самое веселое в этих "защитниках" - полномочия на запрет соединения.

То есть эта посторонняя штука решает - кто кому может позвонить, а кто нет. Что открывает потенциально огромный простор для всякого.

Контролируется (включая какие-никакие настройки и отключение) пользователем.

По сути оно ж бывает двух типов - локальное приложение (без доступа к аудио звонка - чисто по номеру) - спамблокеры вроде Whocalls и куча их и сетевой анализатор когда сеть решает что делать (Тиньковская Оля и ее дополнения). Ну и гибриды (Ева мегафонская?, у которой часть функционала без приложения не работает).

Пока контролируемое.

И вот вспоминаешь про недавнее обсуждение что надо бы запретить по умолчанию звонки с иностранных номеров и видишь внезапно у билайна услугу такую (бесплатну), у WhoCalls галочку про эту блокировку.

И жалобы что человек купил новый номер и не может дозвонится...ждем закон про реестр номеров подлежащих исключению из средств блокировки в связи со сменой владельца (а заодно - и с централизованным добавлением туда номеров мошенников и иноагентов)? :)

Они даже не шифруются и внедряют целые ии сопроцессоры для распознавания голоса. Ну а для прослушивания для таргетирования нужно вычленять только ключевые фразы или слова. Делать это могут сами производители смартов и уже затем продавать или обменивать инфу на биржах. Все указанные в статье эксперементы выглядят весьма дилетанскими.

Эксперимент конечно шикарный.

"Мы дали телефону послушать рекламу, а он не выдал такую же рекламу, значит ничего не слышит"

Похоже на "Майский жук слышит ногами".

Однажды, играя в League of Legends очередной матч, после череды поражений, я написал что они (Riot Games) похоже хотят чтобы я "hang myself on a rope".... Немногим позже моя лента в ютубе была буквально завалена разными видео на тему суицида :D

И телефона рядом, конечно, не было?)

Телефон не при чём -- у меня складывается впечатление, будто Microsoft с Гуглом обмениваются телеметрией, не зря же один из бывших сотрудников MS касаемо темы Windows 11 говорил что "you are a product, not Windows 11".

А в плане рекомендаций Ютуба -- были видео на тему как бороться с мыслями о суициде, о том почему мужчины делают такой выбор и т.д.

По сути, Win 11 промониторила ввод с клавиатуры и передала дальше по цепочке, ну, по крайней мере так кажется.

А что конкретно рекламировалось? Будки самоубийств?

Клуб самоубийц, как в кино... )

КДПВ просто антибомба

Текст, впрочем, такой же. Одно утверждение, что юзеры знали, что ФБ их проверяет и слушает... Автор сам EULA читал, там среди миллиона пунктов очень много чуши

Блин, а можно выбрать в причине минуса “захлебнулся в воде, пока читал статью”?

Краткое содержание статьи на русском языке:

Статья развенчивает распространённый миф о том, что Facebook и другие технологические компании тайно записывают разговоры пользователей через микрофоны смартфонов для показа целевой рекламы. Хотя многие люди сталкивались с ситуациями, когда реклама удивительно точно соответствовала их недавним беседам, доказательств постоянного прослушивания микрофонов не найдено. Эксперименты, проведенные компанией Wandera в 2019 году, показали, что постоянная передача аудиоданных потребляла бы огромные объемы трафика, что легко обнаружить, но таких данных не было зафиксировано.

В 2024 году появилась информация о системе Active Listening от Cox Media Group, которая якобы использовала голосовые данные для таргетинга рекламы. Однако крупные технологические компании, включая Google и Meta, быстро дистанцировались от этого проекта, а CMG заявила о его прекращении. Система, скорее всего, использовала только короткие фрагменты голоса, активируемые командами вроде "Hey Google" или "Hey Siri", а не записывала разговоры круглосуточно.

Исследования, проведенные в Northeastern University, также не обнаружили доказательств скрытого прослушивания, но выявили другие тревожные методы сбора данных, такие как автоматические скриншоты и видеозаписи экрана, передаваемые третьим сторонам. Эти данные, наряду с информацией о местоположении, покупках, социальных связях и поведении в сети, позволяют алгоритмам с высокой точностью предугадывать интересы пользователей и показывать релевантную рекламу.

Главный вывод статьи: компании вроде Facebook не нуждаются в прослушивании разговоров, так как уже обладают огромным количеством данных о пользователях, которые анализируются сложными алгоритмами. Это делает таргетированную рекламу настолько точной, что создается иллюзия, будто компании "подслушивают" частные беседы. Реальность же оказывается сложнее и тревожнее простых теорий заговора.

Вот уж чего не надо, так это LLM-суммаризации. Это еще хуже, чем водянистая статья.

у меня ощущение, что статья тоже писалась с помощью LLM

И комментарии тоже написаны LLM.

Ну не надо, так не надо )
Мне сэкономило немного времени, тем более что вся "вода" вероятно тоже от LLM.

Еще более краткое содержание статьи:

Тревожно.

Офигеть, ещё и минусов накидали )
В статье тонна воды, наверняка сгенерённая LLM. Дай, думаю, сделаю укороченную версию, закину в комментарии, сэкономлю время себе и другим.

Удалил бы, да уже нельзя.

Русский у вас родной ? У меня и жены да, и укороченная версия без воды - это не то, что вы сделали....

Tdrl в целом следующий:

Все отмазываются от того, что постоянно слушают разговоры приводя при этом различные очень подозрительные и малосостоятельные аргументы и опыты.

Т.е. скорее всего всё-таки слушают :).

ЗЫ. А ведь так просто было бы сделать телефон, который аппаратно не включает микрофон без механически нажатой пользователем кнопки. Но его нет :).

Ты с другом обсудил гольф и вот фейсбук тебе показывает клюшки. Ты думаешь, что это была прослушка. На самом деле, твой друг после разговора погуглил правила гольфа. А друзья вы не только в реале, но и в фейсбуке. Или даже проще - начали вы говорить про гольф "ни с того ни с сего" после того как Ваш общий друг в фейсбуке что-то про гольф зашерил. Свобода воли - это иллюзия.

я оставил смарт дома и сходил далеко (сотни тел между точками) к чуваку у которго смарт в mts2g/only (без wifi но edge) да при нём разговаривали про всякое да что один чел сказал что другой дом тогда за млн построил - мы никак на уровне контактов/звонков/im/соцок/gps не связаны а симки (у него на сестру которая за 250+ км живёт с другой фамилией а у меня на мёртвого деда третьей фамилии да смарт по его адресу прописки только обитал не выходя никуда: у меня максимально-возможное на вьетнамце приваси да я молчу при смарте (да никуда с него голосом) и разговариваю негромко в дальней комнате за двумя плотными дверями с кучей преград между ними): прихожу домой и выведя смарт из airplane в incognito (и без профиля гугла) ютубе мне первое видео про то как построить дом дешевле млн руб ... я был готов к такому тк у соседа если про что-нибудь говоришь и вдруг решил в его смарте что-то глянуть да уточнить ещё несмотренное - в строке поиска яндекс уже предлагается вопрос который хотел бы спросить: у чела спрашиваешь смотрел ли он или телек про эти темы или говорил про это ранее - он отвечает что нет да что ты сам эту тему начал (а я с одного-направленного эфира зацепил и переподумав создал в голове отдельный thread который вспомнив озвучил в не своего смарта) ... поэтому был готов что на ближайшем смарте будет реакция но не готов что голос&imei связки есть для персонализации неперсонализированного терминала aosp независимо в какой imei&location ты подал причину - тупо по голосу (как в фантастиках где по сказаному где-либо слову (из двух букв) сразу находят/gps чела) понял (2g) где я и дал ответ не туда где меня нет а туда где я опять хотя молчал при терминале

Где, мать его, запятые.

Что вы не зуммер, а незатейливый идиот - это мы сразу поняли. Но наличие хоть какого-то смысла в излитом потоке сознания до сих пор остаётся загадкой для человечества.

Прочитал два раза. А можно перевод на русский?

Вслух не читайте, я так демона вызвал.

Но подобный стрим данных провоцировал бы нагрузку на процессор смартфона, и она была бы сразу заметна — её практически невозможно скрыть.

Но это же так и есть, куда уж незаметнее. Приложение Facebook всегда находится в топе статистики энергопотребления, даже когда не пользуешься приложением.

Даже выше ютуба? Хотя, смотря кто чем пользуется

А если распознавать голос в процессе разговора, переводить в текст, и отправлять на сервер текст. Анализ скриншотов, и запросов в интернет (всё посещаемые сайты). Анализ ввода через клавиатуру смартфона. Анализ местоположения по координатам сотовых вышек. Анализ частоты вызовов и сопоставление интересов контактов. Анализ статистики расположения смартфонов рядом. Анализ всех фото и файлов в смартфоне. Анализ активности использования по времени суток и другая статистика. Даже анализ установленной системы (даже если всё данные стерли и начисто установили другую систему, всё равно производитель узнаёт).

Всё в совокупности анализов, выдаст всю информацию, о человеке. Где, когда, что его интересует, где работает, какие взгляды и т. д.

«Не для себя интересуюсь, для друга»...

Если соединить ещё всё это с общедоступной информацией, то вообще бомба. Например, юзер провёл в таком-то месте 2 часа, в этом же месте и в это же время проходило мероприятие на такую-то тему. И неважно, что пользователь мог быть там в качестве гардеробщика, это статпогрешность. Главное угадать для основной части пользователей.

На эту тему есть отличный сериал "В поле зрения". Там подобная машина предсказывала вероятность преступлений

Биг дата вполне успешно работает в Китае, и наверняка может предсказывать часть преступлений... прост для верхушки власти её отключили вроде ))) чтоб сами на себя при расследовании не выходили 😁😁🤣

Нет, там не вероятность, а именно само преступление, чисто deus ex machine. А чтобы это не казалось примитивным - у машины есть свой "закон робототехники" - и она говорит только номер соцстрахования жертвы (или убийцы). Несмотря на такой очевидный рояль в кустах, сериал очень неплохой, причем и с точки зрения научной фантастики, и технологий и рассуждения на тему ии. А ещё там направленной антенной взламывают блютузы, чтоб прослушивать противников

А если распознавать голос в процессе разговора, переводить в текст, и отправлять на сервер текст.

Скорее не сам текст, а его "теги".

Лучше текст, его не так много, а интерпретация может меняться по мере совершенствования модели. Лучше не терять первоисточник по возможности.

Можно удалить все, кроме 6-7-8 абзацев с конца

С одним человеком как-то по телефону обсуждали тему, там был упомянут один инструмент, через пару дней мне в интернете пошла реклама этого инструмента. С человеком ни в каких соцсетях не состоим в друзьях, только его номер телефона. Никогда про этот инструмент не интересовался и вообще далек от всего этого. При этом всякие голосовые команды для приложений в телефоне у меня заблочены на системном уровне. Как и разрешения и доступв к разным категориям для приложений все всегда отключаю, запрещая работу в фоне, кроме интернета.

Если оба устройства в одной вай-фай сети, то этого уже немало для анализа)

Вайфаем не пользуюсь, вообще не включаю, а в телефоне отключена функция volte🤷‍♂️

У человека может быть ваш номер в контактах и доступ приложений к ним.

Что значит "может"? У 99% установлен сбербанк онлайн еще с тех времен, конда он требовал доступа к телефонной книге...

Если проприетарное ПО на "наших" девайсах нас не слушает то как возможно это видео?

https://www.youtube.com/watch?v=zBnDWSvaQ1I

Чел выбрал случайную тему, сообщил её по зрительному каналу, показал свой браузер без адблока, немножко поговорил на выбранную тему так чтобы компьютер точно услышал, и зашёл на те же сайты что до разговора. Все сайты стали показывать рекламу на выбранную тему. Шах и мат людям которым "нечего скрывать".

Видео как раз создать не трудно. Видео (на плёнке) ещё 100 лет назад делали с любыми эффектами. Надо проверять самому, только тогда можно что-то сказать, увы.

Читал несколько лет назад интервью бывшего программиста Фейсбука, он говорил что при помощи анализа частотности слов, данных о местоположении и датчика положения аппарата они могли не то что предпочтения для покупок делать и давать нужную контекстную рекламу но даже и знать о болезнях пользователя, о которых ещё не знает и сам владелец телефона. Например легко определялась беременность по изменению походки, заболевания суставов и позвоночника и прочее. Наверное с тех времён прогресс шагнул дальше

Был же громкий скандал, когда сеть магазинов Target предложила товары для молодых мамочек школьнице старших классов. Батя там пошёл в разнос, но выяснилось, что на основе деятельности дочери алгоритм всё верно предположил и батя стал счастливым дедом. Подробнее тут: https://habr.com/ru/articles/147284/

У меня как-то утром заболело колено. Я не гуглил и не говорил про это. Молча еду на маршрутке и на смартфоне выходит реклама "Болят колени? Мазь такая-то". Я прям офигел... Наверно просто совпадение, но было стремно.

Телефон прикладывали к колену? NFC сенсор умеет сканировать как МРТ! /s

Ещё не стоит сбрасывать со счетов эффект Баадера-Майнхофа.

Может реклама мази и так присутствовала в вашем окружении, но баннерная слепота уверенно ее не замечала. А как только что-то заболело, вы сразу обратили внимание.

Когда захотите купить, например, уазик, окажется, что на улицах одни уазики ездят ))

Бывает) Я как-то купил якобы редкий автомобиль в наших краях, но потом начал везде их замечать)

Такая же фигня. Оказалось, что в нашем дворе паркуется аж 6 "французов" считая меня. А были одни немцы да японцы. И город наполнился ПЫжами. Так и до паранойи недалеко )))

Возможно, это одна из самых распространенных и древних теорий заговора в области технологий. Дескать, смартфон постоянно прослушивает всё, о чем вы говорите. И наверняка вы сталкивались с ситуацией, когда общаешься с другом о необходимости купить шуруповёрт и через час видишь актуальную рекламу на платформе социальных сетей.

Мы не фиксируем, не замечаем, не осознаём тысячи несовпадений, зато всего одно совпадение из тысячи может сильно нас взбудоражить. Так уж устроен наш мозг - постоянно выискивает связи и паттерны.

В темах про прослушку телефона постоянно всплывает: "я сказал это, а на следующий день вылезло то". Ну давай проведём эксперимент. Возьми 10 телефонов (чтобы увеличить шансы, если "прослушка" идёт не постоянно а включается периодически, по рандому) и будем громко говорить о том, как же хочется пиццы.

Тут для проверки надо что-то неожиданное. Мне кажется, если профили пользователей "молодой, гуглит айтишные темы, устанавливал приложения пиццерий и суши маркетов" соберутся в одном месте, высока вероятность, что он рекламу еды на "посидеть с коллегами вечерком" засунет в контекст безо всякой прослушки, просто потому что ну а что ещё такие люди покупают, собравшись вместе. Ну кроме классики " ̶ж̶е̶н̶щ̶и̶н̶ы̶/̶л̶о̶ш̶а̶д̶и̶/̶к̶а̶р̶т̶ы̶ машины/работа /отпуск.

Наличие прослушки - это нулевая гипотеза, ибо смартфоны технически вполне могут это делать. Доказывать надо отсутствие этой самой прослушки. А поскольку доказательство отсутствия методически очень сложно, то на практике оно не выполнимо. Следовательно можно считать, что прослушка всегда есть и обходиться со смартфоном так, как если бы это был товарищ майор.

карманный товарищ майор, ага

Как бы это не звучало.

А что тогда - Алиса?

И меняется ли что-то если смартфон - с iOS (более жесткая политика в отношении фоновых штук) или GrapheneOS (с правами для посторонних приложений все очень жестко, Play Services вообщем то тоже касается)

Прослушанный данные не обязательно отправлять сразу. Можно, например, сохранять в памяти, а отправлять тогда, когда пользователь использует интернет. На фоне потребления трафика тем же браузером, 25Мб часовой записи голоса будут незаметны.

ну да, а можно и сразу же анализировать

используя ресурсы того же смартфона

и отправлять уже в сухом остатке целевую информацию

Тогда это было бы заметно в тесте как нерасчетная трата ресурсов.

У меня телефон индексирует фотографии только когда стоит на зарядке.

не зря же NPU во все новые процы суют

Насчет потребления данных и нагрузки на процессор - в телефонах есть отдельный процессорчик/DSP, который умеет ждать и распознавать hey siri и ok google. Потребляет он копейки, и будит основной процессор только в нужное время.

Кто мешает поручить ему "слушать" еще пару сотен (или тысячу) задаваемых заранее ключевых слов, а при просыпании основного процессора попутно с остальными данными отправлять хозяину устройства еще и блобчик с отмеченными словами, прозвучавшими за прошедшее время. Это будут даже не килобайты, а сотни байт данных.

Причем ключевые слова можно выставлять в зависимости от категории пользователя устройства - возраста, пола, места проживания. Уххх, понесло...

а это аппаратный ресурс? т.е. отдельный маленький чип для прослушки?

ну точно, маленький товарищ майорчик

Часто это часть SoC, но не обязательно.

Но логически - отдельный процессор.

Вспоминается статья Яндекса https://habr.com/ru/companies/yandex/articles/431998/ там есть небольшой раздел как они решали проблему чтобы Алиса пользователя слушала без активации основного процессора.

но надо его учить еще и русскому и китайскому и суахили

Необязательно слушать каждый конкретный разговор.

По звуку можно собрать огромное количество информации о пациенте в копилочку биг-даты.

Половозрастной состав семьи, животные, любимая музыка и телеканалы, половая активность, храп, здоровье.

Если орать "большие сиськи" или "увеличить писюн", то не работает )))

Потому что этот тип рекламы идёт по дефолту, ага.

лучший ;)))))

Надо кричать что-то одно. Маркетологи давно поняли что обе услуги враз не имеют платежеспособного спроса )

всё понятно кроме одного :( почему же всё-таки не ведётся прослушки (как утверждается)? технически это крайне возможно. Было бы глупо отказываться от предоставленных возможностей

После того, как поставил AdGuard, проблема прослушки меня не волнует (сарказм)

"ставь лайк если тобой невозможно манипулировать" :)

Скорости беспроводных технологий всё растут, это позволит маскировать трафик пересылаемых медиа-материалов. А любой мониторинг из функционала самого телефона будет показывать то, что нужно, а не по факту. Для получения объективных данных о трафике нужно прогонять его через имитатор базовых станций с DPI-опцией и генератором GPS-сигнала, например R&S CMW500 + R&S SMBV100A.

С DPI...проблема в том, что установку не-штатных Root CA поддерживают ой не все.

При попытке включить на уровне сети MITM (для хороших с моей точки зрения целей - роутер мой ж) - куча всего ложится (яндекс станция, лампочки всякие и прочее) и либо прописывать исключения либо не работает, ах да - прописать исключения только по IP-адресам устройств, лезут они куда попало.

С мобильным трафиком - сертификат то поставить можно но тоже очень весело, глюки в произвольных местах (в ВКВидео(именно видео а не сам ВК) например) + там и на уровне системы новые грабли добавляются если ставить в системное хранилище: https://httptoolkit.com/blog/android-14-breaks-system-certificate-installation/ (правда обходится - https://httptoolkit.com/blog/android-14-install-system-ca-certificate/ ) и на уровне Chrome - https://httptoolkit.com/blog/chrome-android-certificate-transparency/ (сделано хитро - если сертификат в системном хранилище - должны выполнятся все требования для публичных сертификатов включая CT-логи, а если в пользовательском - приложение может прикрыть)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации