MisterClever 25 апр в 21:33

Смартфон не прослушивает вас в фоновом режиме. Истина куда страшнее

Простой

10 мин

44K

Социальные сети и сообществаКонтекстная реклама*Медийная реклама*Будущее здесьСмартфоны

Обзор

Перевод

126

Комментарии 126

continuingolive 25 апр в 21:43

даже домашнии аналоговые проводные прослушивали

MisterClever 25 апр в 21:52

В статье разбирается почему "прослушка" в формате сбора аудио-материала бессмысленна, и какие есть более продвинутые методы

tolyanski 25 апр в 22:36

Не вижу в статье информации, почему она "бессмысленна". Вижу только утверждения, что, "возможно, аудиопрослушка не ведется", на основании какого-то одного эксперимента

RoasterToaster 25 апр в 23:00

Потому что человеки примерно одинаковые и их можно на пару сотен категорий разделить и таргетно показывать рекламу, а ещё человеки очень предсказуемые. Нет смысла слушать блеяние каждой овцы в стаде.

askv 26 апр в 00:05

Да, я тоже пришёл к такому выводу, правда, весьма умозрительно. Наверняка учитываются факторы, которые соцсети и так доступны: время, сколько юзернейм проводит в соцсети, какие страницы читает, местоположение и т.д. и т.п. А дальше вопрос чисто корреляций.

Politura 26 апр в 04:31

Почему собирать с вас телеметрию и ваше местоположение смысл имеет настолько, что все приложения в вашем телефоне этим занимаются (1, 2), а собирать ваши разговоры, хотя-бы переведенные в текст, чтоб место сэкономить, уже смысла и нет?

MisterClever 26 апр в 07:54

Потому, что собирать мета-данные проще, так как они весят меньше, чем аудио

Ndochp 26 апр в 12:32

Вот только в андроиде голосовой набор работает в авиарежиме.

acyp 26 апр в 12:36

Видимо от версии зависит. У меня не работает. Только, если в авиа подключиться к вайфаю.

fujikiriku 26 апр в 17:13

https://f-droid.org/packages/org.woheller69.whisper

Такой же голосовой набор, но работающий на устройстве, ну или аналог

Модель весит мегабайт 300-500

Dr_Faksov 26 апр в 05:25

Если мне память не изменяет, то в "Книге Перемен" утверждается, что в жизни существует всего 52 ситуации. И вроде было исследование, что сюжетов в литературе тоже всего несколько сотен.

Vsevo10d 26 апр в 11:20

64 гексаграммы и от 134 до 2500 архетипичных сказок в зависимости от глубины проработки классификатора.

А еще существуют 36 китайских стратагем, их вариация на тему "игры, в которые играют люди".

xSVPx 26 апр в 21:09

В литературе три.

О великой любви

О великом походе

Не помню :)

MisterClever 26 апр в 07:53

Прочитайте внимательнее: её легче заметить по расходу данных и нагрузке на процессор

Плюс тем, кто слушает потребуется хранилище в несколько петабайт

HardWrMan 26 апр в 08:22

Плюс тем, кто слушает потребуется хранилище в несколько петабайт

Зачем? Кто в здравом уме, целенаправленно разрабатывающий и уже имея рабочий алгоритм распознавания аудио в текст будет хранить сырое аудио даже в низкобитрейтном кодеке? Распознали на лету в ТХТ и сохранили. 1 мегабайт ТХТ это тысячи страниц текста, который вы будете набалтывать неделями. А текст ещё и отфильтровать по токенам можно. Миф с нехваткой места специально раздувается для усыпления внимания людей.

AHL 26 апр в 13:30

Одна печатная страница на пишущей машинке это две тысячи знаков. Сл-но 1 мегабайт это пятьсот страниц.

HardWrMan 26 апр в 14:02

Ну я условно-гипертрофировано. Тем не менее, нужно постараться, чтобы наговорить столько, чтобы полностью заполнить всё печатное пространство страницы без пустых строк и значительных пробелов. А диалоги вообще разряженые обычно, как в жизни так и в книгах.

gxcreator 26 апр в 17:00

Так текст просто прекрасно сжимается, зачем хранить сырые данные вместо пожатых gz/zstd/etc?

tolyanski 27 апр в 17:59

Я однажды совершенно случайно провел интересный "эксперимент". Была у меня Яндекс.Станция, купил по приколу. Поигрался с ней пару месяцев, да и надоела мне она. Но как блютус-колонка она оказалась очень даже ничего.

В итоге, включил я Алису в режиме блютуса, подрубил к ней ноут, и весь мой ютубчик с ноута играл на Алисе. Все было просто идеально.

Прошла неделя-две-месяц, и вот я у себя дома поменял роутер, а новые настройки вайфая Алисе не рассказал. Колонка оказалась в полном офлайне, только подключенная к ноуту по блютусу. Алиса продолжила воспроизводить звуки моего компа, но где-то через неделю (или даже пару дней, не помню) начала самопроизвольно отключаться полностью (так чтоб прям совсем гаснуть). Попробовал отключить из розетки и включить заново: в этом случае она включалась, загружалась, работала минут 15 нормально в режиме блютус-колонки - и снова отрубалась.

Ну все, сломалась, подумал я. А потом взял да и подключил ее к новому своему вайфаю - и вуаля! проблема исчезла. Снова все стало работать отлично, без внезапных отключений.

Через какое-то время повторил "эксперимент" в точности - и проблема опять воспроизвелась. И опять решилась путем подключения колонки к интернету.

То есть алгоритм такой:

Отключаем колонку от интернета;
Пользуемся колонкой неделю (+/-) в режиме блютуса, то есть колонка постоянно включена, но не имеет доступа в интернет;
Через неделю колонка без предупреждения полностью отключается, временно превращается в "кирпич";
Отключаем блок питания, включаем заново;
Колонка включается;
Далее при каждом включении работает не более 15 минут, через 15 минут отключается снова;
Если включить ее опять и успеть скинуть настройки вайфая - все сразу становится хорошо.

Какая причина такого поведения напрашивается? Ну конечно же, - у колонки есть определенный буфер для записанных с микрофона данных. Когда колонка в сети - она периодически скидывает этот буфер в облако, освобождая место. А когда интернет пропал, то буфер переполняется, и разработчики Алисы не подумали что какой-то идиот будет держать колонку долго в оффлайне - и вот вам баг, который (возможно) спалил нехорошее поведение.

tolyanski 27 апр в 19:05

Прочитайте внимательнее: её легче заметить по расходу данных и нагрузке на процессор

Под "смыслом" каких-то действий обычно подразумевают профит, а не наличие/отсутствие возможности совершать эти действия незаметно.

Профит от этого очевиден. А возможность делать это, оставаясь незамеченным, - сильно зависит от каждой конкретной реализации данной задачи. Завтра какой-нибудь Эппл запилит новую версию силикон-процессора (если уже не), в котором например будет скрытое ядро, не отображаемое ни в каких утилитах мониторинга, - и вот вам прослушка которую не заметили.

Byteler 26 апр в 15:31

Ключевое слово "домашнии" . Пацан зарегистрировался меньше суток назад (из Пикаба?) и на 53 комментария сумма плюсиков = 0

vikarti 27 апр в 05:21

Ну вот про скриншоты пример - сказано что скриншоты себя же и даже иногда видео (насколько помню кстати Amplitude что-то похожее может). Но тогда это не такая угроза - данные которые приложение отображает - и так ему доступны (ну кроме особых случаев с DRM-контентом). Вот если бы посторонних приложений скриншоты реально делались.

HardWrMan 27 апр в 06:01

Себя - это расплывчато сказано. Может, экрана с активным собой? Но там хватает инфы в статусе и всплывающих уведомлениях.

gun_dose 25 апр в 22:39

Устройство с голосовым управлением включается на мгновение, как только локально обнаруживает ключевую команду

Вот только для того, чтобы обнаружить ту самую голосовую команду, микрофон должен быть постоянно включен и абсолютно все звуки, которые ловит этот микрофон, должны анализироваться. Понятно, что вычленить из всего фона простую команду типа "окей гугл" можно с помощью достаточно грубого анализа, не углубляясь в смысл разговора и даже не транскрибируя его. Вот только никто не знает точно, на какие ещё команды может тригериться этот помощник.

Но самое стрёмное - это не фэйсбуки с гуглами, а всякие новомодные онлайн-защитники от мошенничества, предлагаемые мобильными операторами. Вот там реально идёт глубокий анализ разговора с транскрипцией. И то, что одна государственная или т.н. "афиллированная с государством" компания по заказу другой подобной компании может собрать, проанализировать и передать ей какие угодно данные, не вызывает никаких сомнений.

mnemonik01 26 апр в 00:58

Есть ещё более стремное, когда целые датацентры с большим количеством специально обученных миньонов целенаправленно работают на ниве выкачивания денег самыми изощренными методами

gun_dose 26 апр в 07:49

Вы имеете в виду телефонных мошенников или маркетологов, которые своей следящей рекламой заставляют домохозяек покупать всякий пластмассовый хлам на маркетплейсах?

kvazimoda24 26 апр в 11:37

А есть принципиальная разница?

gun_dose 26 апр в 11:41

Разница только в том, что этот сервис заменяет одних другими

AHL 26 апр в 13:28

это не принципиальная разница

agat000 26 апр в 11:04

Самое веселое в этих "защитниках" - полномочия на запрет соединения.

То есть эта посторонняя штука решает - кто кому может позвонить, а кто нет. Что открывает потенциально огромный простор для всякого.

vikarti 27 апр в 05:29

Контролируется (включая какие-никакие настройки и отключение) пользователем.

По сути оно ж бывает двух типов - локальное приложение (без доступа к аудио звонка - чисто по номеру) - спамблокеры вроде Whocalls и куча их и сетевой анализатор когда сеть решает что делать (Тиньковская Оля и ее дополнения). Ну и гибриды (Ева мегафонская?, у которой часть функционала без приложения не работает).

Пока контролируемое.

И вот вспоминаешь про недавнее обсуждение что надо бы запретить по умолчанию звонки с иностранных номеров и видишь внезапно у билайна услугу такую (бесплатну), у WhoCalls галочку про эту блокировку.

И жалобы что человек купил новый номер и не может дозвонится...ждем закон про реестр номеров подлежащих исключению из средств блокировки в связи со сменой владельца (а заодно - и с централизованным добавлением туда номеров мошенников и иноагентов)? :)

Kano 27 апр в 01:30

Они даже не шифруются и внедряют целые ии сопроцессоры для распознавания голоса. Ну а для прослушивания для таргетирования нужно вычленять только ключевые фразы или слова. Делать это могут сами производители смартов и уже затем продавать или обменивать инфу на биржах. Все указанные в статье эксперементы выглядят весьма дилетанскими.

agat000 27 апр в 05:36

Эксперимент конечно шикарный.

"Мы дали телефону послушать рекламу, а он не выдал такую же рекламу, значит ничего не слышит"

Похоже на "Майский жук слышит ногами".

FrozenTwilight 25 апр в 23:14

Однажды, играя в League of Legends очередной матч, после череды поражений, я написал что они (Riot Games) похоже хотят чтобы я "hang myself on a rope".... Немногим позже моя лента в ютубе была буквально завалена разными видео на тему суицида :D

vanxant 26 апр в 00:23

И телефона рядом, конечно, не было?)

FrozenTwilight 26 апр в 23:19

Телефон не при чём -- у меня складывается впечатление, будто Microsoft с Гуглом обмениваются телеметрией, не зря же один из бывших сотрудников MS касаемо темы Windows 11 говорил что "you are a product, not Windows 11".

А в плане рекомендаций Ютуба -- были видео на тему как бороться с мыслями о суициде, о том почему мужчины делают такой выбор и т.д.

По сути, Win 11 промониторила ввод с клавиатуры и передала дальше по цепочке, ну, по крайней мере так кажется.

Arlekcangp 27 апр в 12:12

Не думаю, что сами ms и google. Скорее в приложения зашиты sdk компаний, собирающих данные для рекламщиков. На андройде это именно так реализовано. И вот тут в статье сказано, мол "не будут микрофон держать включенным"... Но некоторые приложения имеют доступ к микрофону (всякие рекордеры, мессенджеры и т д) и ничто не мешает sdk в их составе делать две вещи: делать запись эпизодически либо искать ключевое слово из списка. Само приложение и его автор может об этом даже не подозревать (особенно,если sdk явно не требует запрос доступа к микрофону, а просто смотрит если он есть - включаем модуль анализа. И получается искать надо в таких приложениях, где он есть. Особенно в играх и в тех, кто в потенциале может в фоне работать)

Как уже говорили, сейчас в каждом смартфоне есть либо dsp, либо ии сопроцессор/ядро. Потребление ресурсов основного процессора на распознавание аудио будет минимальным. (Тем более что линукс, коим является андроид далеко не всегда адекватно показывает загрузку cpu. В экспериментах нужно смотреть на расход батареи) .

Единственное что противоречит этой "теории заговора" - это отсутствие найденных "жуков". Но так судя по всему этим не очень много людей занято. С учетом того, что только вот недавно один человек более приземленной вещью озадачился - а куда эти рекламные sdk шлют данные и какие? (Был на хабре буквально пару дней назад перевод статьи. Там как раз подопытной была игра на платформе юнити )

RTFM13 27 апр в 20:32

у меня складывается впечатление, будто Microsoft с Гуглом обмениваются телеметрией

Крупные все в той или иной мере сотрудничают в этой сфере. При чем со времён еще до повления смартфонов.

ImagineTables 26 апр в 00:27

А что конкретно рекламировалось? Будки самоубийств?

askv 26 апр в 06:33

Клуб самоубийц, как в кино... )

achekalin 25 апр в 23:18

КДПВ просто антибомба

Текст, впрочем, такой же. Одно утверждение, что юзеры знали, что ФБ их проверяет и слушает... Автор сам EULA читал, там среди миллиона пунктов очень много чуши

vvzvlad 26 апр в 00:37

Блин, а можно выбрать в причине минуса “захлебнулся в воде, пока читал статью”?

axion-1 26 апр в 01:20

Краткое содержание статьи на русском языке:

Статья развенчивает распространённый миф о том, что Facebook и другие технологические компании тайно записывают разговоры пользователей через микрофоны смартфонов для показа целевой рекламы. Хотя многие люди сталкивались с ситуациями, когда реклама удивительно точно соответствовала их недавним беседам, доказательств постоянного прослушивания микрофонов не найдено. Эксперименты, проведенные компанией Wandera в 2019 году, показали, что постоянная передача аудиоданных потребляла бы огромные объемы трафика, что легко обнаружить, но таких данных не было зафиксировано.

В 2024 году появилась информация о системе Active Listening от Cox Media Group, которая якобы использовала голосовые данные для таргетинга рекламы. Однако крупные технологические компании, включая Google и Meta, быстро дистанцировались от этого проекта, а CMG заявила о его прекращении. Система, скорее всего, использовала только короткие фрагменты голоса, активируемые командами вроде "Hey Google" или "Hey Siri", а не записывала разговоры круглосуточно.

Исследования, проведенные в Northeastern University, также не обнаружили доказательств скрытого прослушивания, но выявили другие тревожные методы сбора данных, такие как автоматические скриншоты и видеозаписи экрана, передаваемые третьим сторонам. Эти данные, наряду с информацией о местоположении, покупках, социальных связях и поведении в сети, позволяют алгоритмам с высокой точностью предугадывать интересы пользователей и показывать релевантную рекламу.

Главный вывод статьи: компании вроде Facebook не нуждаются в прослушивании разговоров, так как уже обладают огромным количеством данных о пользователях, которые анализируются сложными алгоритмами. Это делает таргетированную рекламу настолько точной, что создается иллюзия, будто компании "подслушивают" частные беседы. Реальность же оказывается сложнее и тревожнее простых теорий заговора.

vvzvlad 26 апр в 01:22

Вот уж чего не надо, так это LLM-суммаризации. Это еще хуже, чем водянистая статья.

YuriPanchul 26 апр в 01:50

у меня ощущение, что статья тоже писалась с помощью LLM

askv 26 апр в 06:35

И комментарии тоже написаны LLM.

axion-1 26 апр в 11:14

Ну не надо, так не надо )
Мне сэкономило немного времени, тем более что вся "вода" вероятно тоже от LLM.

ABy 26 апр в 07:03

Еще более краткое содержание статьи:

Тревожно.

gedo 27 апр в 17:56

Мне нравится, дайте два

axion-1 26 апр в 14:08

Офигеть, ещё и минусов накидали )
В статье тонна воды, наверняка сгенерённая LLM. Дай, думаю, сделаю укороченную версию, закину в комментарии, сэкономлю время себе и другим.

Удалил бы, да уже нельзя.

xSVPx 26 апр в 21:16

Русский у вас родной ? У меня и жены да, и укороченная версия без воды - это не то, что вы сделали....

Tdrl в целом следующий:

Все отмазываются от того, что постоянно слушают разговоры приводя при этом различные очень подозрительные и малосостоятельные аргументы и опыты.

Т.е. скорее всего всё-таки слушают :).

ЗЫ. А ведь так просто было бы сделать телефон, который аппаратно не включает микрофон без механически нажатой пользователем кнопки. Но его нет :).

achekalin 27 апр в 19:33

Да слушают, слушают. Эпл изобретает нечеловечески красивый способ не передавать персональные данные для распозхнавания "Эй, Сири", а приложения вроде тех, что от Яндекса, работают, как думается, всё же, наоборот - стучат-с!

А что в статье написано, причем написано как обобщение двух-трех исследований ~~британских ученых~~ на деньги грантов - и написано с припиской, что "правда еще страшнее" - это может сойти за частное мнение автора текста (промпта, отправленного в GPT), но только факт говорят обратное.

Условно, когда я обсудил со знакомым его, знакомого, рыбалку, и через 20 минут начинаю видеть баннеры про удочки - это уже не подозрение, это уверенность!

NNikolay 26 апр в 03:33

Ты с другом обсудил гольф и вот фейсбук тебе показывает клюшки. Ты думаешь, что это была прослушка. На самом деле, твой друг после разговора погуглил правила гольфа. А друзья вы не только в реале, но и в фейсбуке. Или даже проще - начали вы говорить про гольф "ни с того ни с сего" после того как Ваш общий друг в фейсбуке что-то про гольф зашерил. Свобода воли - это иллюзия.

continuingolive 26 апр в 12:45

я оставил смарт дома и сходил далеко (сотни тел между точками) к чуваку у которго смарт в mts2g/only (без wifi но edge) да при нём разговаривали про всякое да что один чел сказал что другой дом тогда за млн построил - мы никак на уровне контактов/звонков/im/соцок/gps не связаны а симки (у него на сестру которая за 250+ км живёт с другой фамилией а у меня на мёртвого деда третьей фамилии да смарт по его адресу прописки только обитал не выходя никуда: у меня максимально-возможное на вьетнамце приваси да я молчу при смарте (да никуда с него голосом) и разговариваю негромко в дальней комнате за двумя плотными дверями с кучей преград между ними): прихожу домой и выведя смарт из airplane в incognito (и без профиля гугла) ютубе мне первое видео про то как построить дом дешевле млн руб ... я был готов к такому тк у соседа если про что-нибудь говоришь и вдруг решил в его смарте что-то глянуть да уточнить ещё несмотренное - в строке поиска яндекс уже предлагается вопрос который хотел бы спросить: у чела спрашиваешь смотрел ли он или телек про эти темы или говорил про это ранее - он отвечает что нет да что ты сам эту тему начал (а я с одного-направленного эфира зацепил и переподумав создал в голове отдельный thread который вспомнив озвучил в не своего смарта) ... поэтому был готов что на ближайшем смарте будет реакция но не готов что голос&imei связки есть для персонализации неперсонализированного терминала aosp независимо в какой imei&location ты подал причину - тупо по голосу (как в фантастиках где по сказаному где-либо слову (из двух букв) сразу находят/gps чела) понял (2g) где я и дал ответ не туда где меня нет а туда где я опять хотя молчал при терминале

noncinque 26 апр в 13:34

Где, мать его, запятые.

continuingolive 26 апр в 14:15

я не зумер а 0xFF

@alexwm

Прочитал два раза. А можно перевод на русский?

вслух попробуй

alexwm 26 апр в 19:35

Что вы не зуммер, а незатейливый идиот - это мы сразу поняли. Но наличие хоть какого-то смысла в излитом потоке сознания до сих пор остаётся загадкой для человечества.

achekalin 27 апр в 19:37

Кинул текстовку выше в DeepSeek R1. Машина оказалась терпеливее меня, вот итог:

Автор поста выражает подозрение, что смартфоны или приложения тайно подслушивают разговоры, даже в условиях, когда это технически кажется невозможным. Он приводит примеры:
После обсуждения дорогого дома с человеком, чей телефон был на 2G (без Wi-Fi), в его собственном смартфоне (в режиме инкогнито, без аккаунта) появилось видео о строительстве дома за миллион.
У соседа в поисковой строке возникали вопросы, которые он хотел задать, хотя сосед отрицал поиск по этой теме.
Его выводы:
Системы якобы умеют идентифицировать пользователя по голосу, связывать его с IMEI/местоположением, даже если нет явной привязки через соцсети, GPS или SIM.
Персонализация контента работает «как в фантастике» — будто ключевые слова из разговоров автоматически запускают таргетинг, минуя настройки приватности.
Суть: Автор убеждён, что телефоны скрыто анализируют речь и используют её для рекламы/контента, несмотря на меры защиты (анонимные SIM, режим полёта, физическое расстояние от устройства). Это вызывает у него тревогу о тотальной слежке через гаджеты.

Пора Хабру не за пустой контент платить, а через GPT суть комментов "проявлять" - это точно будет востребовано (шутка)!

alexwm 26 апр в 14:11

Прочитал два раза. А можно перевод на русский?

pes_loxmaty 26 апр в 20:33

Новую модель похоже запустили DrunkSKUF_AI

RulenBagdasis 26 апр в 23:44

Вслух не читайте, я так демона вызвал.

gedo 27 апр в 18:06

Возможно, вы не настолько изолированы, как вы думаете, или вам просто повезло. Согласитесь, недорогие дома это достаточно популярный товар, это не экзотика типа 3д принтеров или доильных аппаратов, такая реклама может откручиваться всем.

sergio_nsk 26 апр в 05:27

Но подобный стрим данных провоцировал бы нагрузку на процессор смартфона, и она была бы сразу заметна — её практически невозможно скрыть.

Но это же так и есть, куда уж незаметнее. Приложение Facebook всегда находится в топе статистики энергопотребления, даже когда не пользуешься приложением.

MisterClever 26 апр в 07:56

Даже выше ютуба? Хотя, смотря кто чем пользуется

T700 26 апр в 05:44

А если распознавать голос в процессе разговора, переводить в текст, и отправлять на сервер текст. Анализ скриншотов, и запросов в интернет (всё посещаемые сайты). Анализ ввода через клавиатуру смартфона. Анализ местоположения по координатам сотовых вышек. Анализ частоты вызовов и сопоставление интересов контактов. Анализ статистики расположения смартфонов рядом. Анализ всех фото и файлов в смартфоне. Анализ активности использования по времени суток и другая статистика. Даже анализ установленной системы (даже если всё данные стерли и начисто установили другую систему, всё равно производитель узнаёт).

Всё в совокупности анализов, выдаст всю информацию, о человеке. Где, когда, что его интересует, где работает, какие взгляды и т. д.

askv 26 апр в 06:37

«Не для себя интересуюсь, для друга»...

askv 26 апр в 07:00

Если соединить ещё всё это с общедоступной информацией, то вообще бомба. Например, юзер провёл в таком-то месте 2 часа, в этом же месте и в это же время проходило мероприятие на такую-то тему. И неважно, что пользователь мог быть там в качестве гардеробщика, это статпогрешность. Главное угадать для основной части пользователей.

MisterClever 26 апр в 07:59

На эту тему есть отличный сериал "В поле зрения". Там подобная машина предсказывала вероятность преступлений

Olegsoft 26 апр в 12:12

Биг дата вполне успешно работает в Китае, и наверняка может предсказывать часть преступлений... прост для верхушки власти её отключили вроде ))) чтоб сами на себя при расследовании не выходили 😁😁🤣

fujikiriku 26 апр в 17:26

Нет, там не вероятность, а именно само преступление, чисто deus ex machine. А чтобы это не казалось примитивным - у машины есть свой "закон робототехники" - и она говорит только номер соцстрахования жертвы (или убийцы). Несмотря на такой очевидный рояль в кустах, сериал очень неплохой, причем и с точки зрения научной фантастики, и технологий и рассуждения на тему ии. А ещё там направленной антенной взламывают блютузы, чтоб прослушивать противников

Nulliusinverba 27 апр в 23:58

И несмотря на то, что уже с десяток лет прошло с окончания сериала, он во многом ещё выглядит актуальным/свежим/не сильно устаревшим.

ifap 26 апр в 10:12

А если распознавать голос в процессе разговора, переводить в текст, и отправлять на сервер текст.

Скорее не сам текст, а его "теги".

askv 26 апр в 10:47

Лучше текст, его не так много, а интерпретация может меняться по мере совершенствования модели. Лучше не терять первоисточник по возможности.

gmtd 26 апр в 06:42

Можно удалить все, кроме 6-7-8 абзацев с конца

Villy_Vallo 26 апр в 07:59

С одним человеком как-то по телефону обсуждали тему, там был упомянут один инструмент, через пару дней мне в интернете пошла реклама этого инструмента. С человеком ни в каких соцсетях не состоим в друзьях, только его номер телефона. Никогда про этот инструмент не интересовался и вообще далек от всего этого. При этом всякие голосовые команды для приложений в телефоне у меня заблочены на системном уровне. Как и разрешения и доступв к разным категориям для приложений все всегда отключаю, запрещая работу в фоне, кроме интернета.

MisterClever 26 апр в 08:00

Если оба устройства в одной вай-фай сети, то этого уже немало для анализа)

Villy_Vallo 26 апр в 08:11

Вайфаем не пользуюсь, вообще не включаю, а в телефоне отключена функция volte🤷‍♂️

unicrus 26 апр в 11:23

У человека может быть ваш номер в контактах и доступ приложений к ним.

xSVPx 26 апр в 23:53

Что значит "может"? У 99% установлен сбербанк онлайн еще с тех времен, конда он требовал доступа к телефонной книге...

eimrine 26 апр в 07:59

Если проприетарное ПО на "наших" девайсах нас не слушает то как возможно это видео?

https://www.youtube.com/watch?v=zBnDWSvaQ1I

Чел выбрал случайную тему, сообщил её по зрительному каналу, показал свой браузер без адблока, немножко поговорил на выбранную тему так чтобы компьютер точно услышал, и зашёл на те же сайты что до разговора. Все сайты стали показывать рекламу на выбранную тему. Шах и мат людям которым "нечего скрывать".

odissey_nemo 27 апр в 02:10

Видео как раз создать не трудно. Видео (на плёнке) ещё 100 лет назад делали с любыми эффектами. Надо проверять самому, только тогда можно что-то сказать, увы.

eimrine 27 апр в 09:08

С первой частью сообщения согласен, даже не подумал что у настолько шпионящей ОС могут быть пропоненты. Ну правда, может быть у него на лаптопе несколько виртуалок с переключением педалькой.

Со второй частью не согласен - нет и не может быть протокола проверки. Если даже automotive индустрия обманывает весь мир с использованием компюьтера, то что мешает вендору зафольксвагенить того кто будет проверять самому? А может вообще просто драйвер микрофона заглючит из-за неправильной погоды на Юпитере и будет сделан вывод что шпионажа нет.

odissey_nemo 28 апр в 08:51

Да, протокола нет. Но можно воспроизвести процедуру автора и... сообщить, что таки да, всё произошло так же или похоже. Или - нет, ничего похожего достичь не удалось. В принципе, это нормальный ход научного исследования. Кто-то делает опыт и полностью его описывает в печати. Другие (учёные) его читают и пытаются по описанию воспроизвести. И результат тоже печатают. Так и живут)))

scevola 26 апр в 08:23

Читал несколько лет назад интервью бывшего программиста Фейсбука, он говорил что при помощи анализа частотности слов, данных о местоположении и датчика положения аппарата они могли не то что предпочтения для покупок делать и давать нужную контекстную рекламу но даже и знать о болезнях пользователя, о которых ещё не знает и сам владелец телефона. Например легко определялась беременность по изменению походки, заболевания суставов и позвоночника и прочее. Наверное с тех времён прогресс шагнул дальше

HardWrMan 26 апр в 08:33

Был же громкий скандал, когда сеть магазинов Target предложила товары для молодых мамочек школьнице старших классов. Батя там пошёл в разнос, но выяснилось, что на основе деятельности дочери алгоритм всё верно предположил и батя стал ~~счастливым~~ дедом. Подробнее тут: https://habr.com/ru/articles/147284/

max-daniels 26 апр в 08:25

У меня как-то утром заболело колено. Я не гуглил и не говорил про это. Молча еду на маршрутке и на смартфоне выходит реклама "Болят колени? Мазь такая-то". Я прям офигел... Наверно просто совпадение, но было стремно.

HardWrMan 26 апр в 08:36

Телефон прикладывали к колену? NFC сенсор умеет сканировать как МРТ! /s

pes_loxmaty 26 апр в 12:15

Ещё не стоит сбрасывать со счетов эффект Баадера-Майнхофа.

Может реклама мази и так присутствовала в вашем окружении, но баннерная слепота уверенно ее не замечала. А как только что-то заболело, вы сразу обратили внимание.

RulenBagdasis 26 апр в 23:47

Когда захотите купить, например, уазик, окажется, что на улицах одни уазики ездят ))

max-daniels 27 апр в 05:19

Бывает) Я как-то купил якобы редкий автомобиль в наших краях, но потом начал везде их замечать)

agat000 27 апр в 05:43

Такая же фигня. Оказалось, что в нашем дворе паркуется аж 6 "французов" считая меня. А были одни немцы да японцы. И город наполнился ПЫжами. Так и до паранойи недалеко )))

xsevenbeta 26 апр в 08:37

Возможно, это одна из самых распространенных и древних теорий заговора в области технологий. Дескать, смартфон постоянно прослушивает всё, о чем вы говорите. И наверняка вы сталкивались с ситуацией, когда общаешься с другом о необходимости купить шуруповёрт и через час видишь актуальную рекламу на платформе социальных сетей.

Мы не фиксируем, не замечаем, не осознаём тысячи несовпадений, зато всего одно совпадение из тысячи может сильно нас взбудоражить. Так уж устроен наш мозг - постоянно выискивает связи и паттерны.

В темах про прослушку телефона постоянно всплывает: "я сказал это, а на следующий день вылезло то". Ну давай проведём эксперимент. Возьми 10 телефонов (чтобы увеличить шансы, если "прослушка" идёт не постоянно а включается периодически, по рандому) и будем громко говорить о том, как же хочется пиццы.

Radisto 26 апр в 09:50

Тут для проверки надо что-то неожиданное. Мне кажется, если профили пользователей "молодой, гуглит айтишные темы, устанавливал приложения пиццерий и суши маркетов" соберутся в одном месте, высока вероятность, что он рекламу еды на "посидеть с коллегами вечерком" засунет в контекст безо всякой прослушки, просто потому что ну а что ещё такие люди покупают, собравшись вместе. Ну кроме классики " ̶ж̶е̶н̶щ̶и̶н̶ы̶/̶л̶о̶ш̶а̶д̶и̶/̶к̶а̶р̶т̶ы̶ машины/работа /отпуск.

Panzerschrek 26 апр в 09:08

Наличие прослушки - это нулевая гипотеза, ибо смартфоны технически вполне могут это делать. Доказывать надо отсутствие этой самой прослушки. А поскольку доказательство отсутствия методически очень сложно, то на практике оно не выполнимо. Следовательно можно считать, что прослушка всегда есть и обходиться со смартфоном так, как если бы это был товарищ майор.

Dmitry_Dor 26 апр в 09:30

и обходиться со смартфоном так, как если бы это был товарищ майор.

¯\_(ツ)_/¯

AHL 26 апр в 12:43

карманный товарищ майор, ага

HardWrMan 26 апр в 12:51

Как бы это не звучало.

vikarti 27 апр в 05:56

А что тогда - Алиса?

И меняется ли что-то если смартфон - с iOS (более жесткая политика в отношении фоновых штук) или GrapheneOS (с правами для посторонних приложений все очень жестко, Play Services вообщем то тоже касается)

RusikR2D2 26 апр в 09:12

Прослушанный данные не обязательно отправлять сразу. Можно, например, сохранять в памяти, а отправлять тогда, когда пользователь использует интернет. На фоне потребления трафика тем же браузером, 25Мб часовой записи голоса будут незаметны.

AHL 26 апр в 12:56

ну да, а можно и сразу же анализировать

используя ресурсы того же смартфона

и отправлять уже в сухом остатке целевую информацию

RusikR2D2 26 апр в 16:33

Тогда это было бы заметно в тесте как нерасчетная трата ресурсов.

funca 27 апр в 00:07

У меня телефон индексирует фотографии только когда стоит на зарядке.

pes_loxmaty 26 апр в 20:36

не зря же NPU во все новые процы суют

YMA 26 апр в 10:15

Насчет потребления данных и нагрузки на процессор - в телефонах есть отдельный процессорчик/DSP, который умеет ждать и распознавать hey siri и ok google. Потребляет он копейки, и будит основной процессор только в нужное время.

Кто мешает поручить ему "слушать" еще пару сотен (или тысячу) задаваемых заранее ключевых слов, а при просыпании основного процессора попутно с остальными данными отправлять хозяину устройства еще и блобчик с отмеченными словами, прозвучавшими за прошедшее время. Это будут даже не килобайты, а сотни байт данных.

Причем ключевые слова можно выставлять в зависимости от категории пользователя устройства - возраста, пола, места проживания. Уххх, понесло...

AHL 26 апр в 12:57

а это аппаратный ресурс? т.е. отдельный маленький чип для прослушки?

ну точно, маленький товарищ майорчик

vikarti 27 апр в 06:00

Часто это часть SoC, но не обязательно.

Но логически - отдельный процессор.

Вспоминается статья Яндекса https://habr.com/ru/companies/yandex/articles/431998/ там есть небольшой раздел как они решали проблему чтобы Алиса пользователя слушала без активации основного процессора.

balamutang 26 апр в 20:57

но надо его учить еще и русскому и китайскому и суахили

YMA 27 апр в 08:42

Русский, китайский, суахили - он про это не знает. Фонемы, форманты, обертоны. :)

agat000 26 апр в 11:14

Необязательно слушать каждый конкретный разговор.

По звуку можно собрать огромное количество информации о пациенте в копилочку биг-даты.

Половозрастной состав семьи, животные, любимая музыка и телеканалы, половая активность, храп, здоровье.

Luboff_sky 26 апр в 12:30

Если орать "большие сиськи" или "увеличить писюн", то не работает )))

HardWrMan 26 апр в 12:40

Потому что этот тип рекламы идёт по дефолту, ага.

AHL 26 апр в 12:59

лучший ;)))))

pes_loxmaty 26 апр в 20:37

Надо кричать что-то одно. Маркетологи давно поняли что обе услуги враз не имеют платежеспособного спроса )

AHL 26 апр в 12:42

всё понятно кроме одного :( почему же всё-таки не ведётся прослушки (как утверждается)? технически это крайне возможно. Было бы глупо отказываться от предоставленных возможностей

gennayo 26 апр в 13:13

После того, как поставил AdGuard, проблема прослушки меня не волнует (сарказм)

balamutang 26 апр в 20:58

"ставь лайк если тобой невозможно манипулировать" :)

ValeriyPus 26 апр в 17:49

(del)

Hajiyev_Tamerlan 26 апр в 19:05

Скорости беспроводных технологий всё растут, это позволит маскировать трафик пересылаемых медиа-материалов. А любой мониторинг из функционала самого телефона будет показывать то, что нужно, а не по факту. Для получения объективных данных о трафике нужно прогонять его через имитатор базовых станций с DPI-опцией и генератором GPS-сигнала, например R&S CMW500 + R&S SMBV100A.

vikarti 27 апр в 06:10

С DPI...проблема в том, что установку не-штатных Root CA поддерживают ой не все.

При попытке включить на уровне сети MITM (для хороших с моей точки зрения целей - роутер мой ж) - куча всего ложится (яндекс станция, лампочки всякие и прочее) и либо прописывать исключения либо не работает, ах да - прописать исключения только по IP-адресам устройств, лезут они куда попало.

С мобильным трафиком - сертификат то поставить можно но тоже очень весело, глюки в произвольных местах (в ВКВидео(именно видео а не сам ВК) например) + там и на уровне системы новые грабли добавляются если ставить в системное хранилище: https://httptoolkit.com/blog/android-14-breaks-system-certificate-installation/ (правда обходится - https://httptoolkit.com/blog/android-14-install-system-ca-certificate/ ) и на уровне Chrome - https://httptoolkit.com/blog/chrome-android-certificate-transparency/ (сделано хитро - если сертификат в системном хранилище - должны выполнятся все требования для публичных сертификатов включая CT-логи, а если в пользовательском - приложение может прикрыть)

Hajiyev_Tamerlan 27 апр в 20:52

Разве не достаточно сведений об объёме исходящего трафика и IP назначения?

vikarti 28 апр в 04:15

Для мониторинга шпионажа со стороны колонки? Так там голосовое распознование почти все на серверах. Ставим триггер на сработку кроме "Алиса","Яндекс" еще и на "Путин","бомба" и сливаем а потом говорим что ошибка в настройках.

HardWrMan 28 апр в 05:56

Ставим триггер на сработку кроме "Алиса","Яндекс" еще и на "Путин","бомба" и сливаем а потом говорим что ошибка в настройках.

А будет ложным срабатывание на чьё-то восхищение, звучащее как "Путин - бомба!"?

1024rk 27 апр в 14:11

Личный пример. Instagram мне уже несколько месяцев настойчиво рекомендует подписаться на пару аккаунтов людей, связь с которыми осуществлялась только в Telegram и только в рамках личных диалогов/приватных чатов - больше нигде. Никакие контакты не создавались и нигде не сохранялись, включая сам телеграм. Никнеймы схожие, но не один в один (хотя профили точно принадлежат тем же людям). Мне это очень не нравится. Даже если не было никакого доступа к микрофону, такой уровень доступа к информации нисхера это очень плохо.

reroll 27 апр в 16:30

У меня был очень критичный случай на счёт прослушки. Так вот ко мне приехал брат и мы с ним в моей комнате говорили и он показал свой телефон и сказал что купил его на алиэкспрессе. А всё дело происходило перед компьютером и у брата и у меня телефоны на андроиде были. Так вот когда я сел за компьютер и стал что то искать и открывать сайты то выскочила реклама как раз купить тот телефон той марки и модели .. Я очень удивился поскольку не делал перед этим каких либо запросов по поиску телефона и как раз в тот момент у меня и появилась причина предполагать что телефоны прослушивают нас. Как ИТ специалист и специалист в области автоматизации и программист в курсе как это сделать, тут в комментариях явные ошибочные суждения пишут. Так вот всё проще, сначала распознаются слова, потом применяется частотный словарь, часть неопределённого просто посылается текстом в сжатом виде с хэшем частотного словаря и при этом трафик не отследить потому что можно передавать в определённые окна активности других приложений, выглядит это как ни с странно как поисковый запрос с метаданными. Система распознаёт метаданные и определяет наличие объектов и индексирует ситуацию. Сама система андроид банально определяет по системе поиска телефона других пользователей и вуаля. В общем схема выглядит по итогу так, на телефоне моего брата приложение прослушало, сделало запрос, гугл определил меня как ещё пользователя, AdSense уже приготовил рекламные шаблоны для моих точек входа в систему рекламы и по итогу я увидел рекламу телефона о котором говорил мой брат. По итогу обсуждение телефона заняло порядка 4 минут, а через 7 минут после начала обсуждения я уже увидел рекламу телефона о котором говорили. По факту нет классической прослушки просто есть слежка и передача метаданных частотного словаря и нераспознанных данных. По этой причине банально невозможно это как то обнаружить, поскольку нужно присутствие хотя бы пары пользователей и обсуждения между ними .. занавес

HardWrMan 27 апр в 16:37

А самый прикол в том, что в 99,999% случаев люди говорят о том, что уже купили. И реклама не работает. Это как реклама на основе поиска. Искал, купил, + месяц эхо в виде рекламы уже купленного.

habus 28 апр в 21:12

Обсуждали с другом по телефону мою предстоящую поездку в Болгарию, и зашла речь про девушек из Болгарии. Вскоре я созерцал рекламу шлифовальных машинок ака болгарки.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий