Pull to refresh

Comments 76

Оказывается, для того чтобы обучать модели нужно размечать данные.
рассказал нам авторитетный доверенный источник из OpenAI.

Зачем читать лицензионное соглашение продуктов и сервисов которыми пользуешься? Амазону точно не важны репутационные потери, они слушают наши разговоры втайне от нас и не страхуются юридически!
утверждает широко известный в узких кругах инфоблоггер-журналист.

обращаясь к Alexa мало кто знает о том, что запись через некоторое время станет доступна сотрудникам Amazon.
говорит анонимный пользователь только что проскролливший EULA за 4 секунды и нажавший кнопку «я прочитал и согласен с условиями пользования».

В общем, никогда такого не было — и вот опять. Скандалы, интриги, расследования!

Ха, удивили, на яндексовской толоке вообще кто угодно выполняет такие задания, а не только сотрудники

-Окей гугл, ты меня прослушиваешь?
-Нет, кожаный ублюдок.
-Убери от меня свою отвертку, мезкий хуман!

Если добровольно покупаешь и устанавливаешь жучок у себя дома, то какие могут быть вопросы к Амазон?

Ну не знаю как амазон, а Яндекс.Станция мне очень понравилась, особенно прикольно подключение к ТВ, для пожилых людей. Я вот точно поставлю родителям, с планшетом они еле еле справляются, а сказать Алисе — включи радио, или ТВ канал (а их там сотни) — очень просто и удобно. Подслушивать их я думаю, бесполезно, даже в коммерческом плане, учитывая размер их пенсии :-(. Вообще я думаю колонки д.б. в каждой больнице + желательно в них добавить коммуникатор типа скайпа (Вызвать сестру, отправить сообщение врачу, позвонить домой ..)

Эти колонки нужны лишь их производителям. Чтобы знать прицельно что и как продавать их хозяевам.

А на чем основано ваше предположение? Спрашиваю как хозяин колонки от Яндекса.

Например, чтобы показать вам рекламу кофемашин, когда вы сказали, что кофе — горький или обратились к сожителю «помой, пожалуйста, кофеварку»

Они не распознают речь постоянно, они слушают только ключевую фразу, а потом уже отправляют на распознавание фразу. Ключевая фраза всего одна (ну или несколько, в любом случае нейронные сети именно на них натренированы). Само этого, распознование ведётся именно на сервере. И если бы был постоянный потом трафика, это быстро бы спалили.
А теперь объясните мне, каким образом при таких условиях, мне покажут рекламу кофемашин, если я буду говорить дома о кофе?

Постоянный поток не нужен. Нужно только когда есть что-то похожее на звук передавать. Плюс голос хорошо так сжимается. Плюс можно делать предварительное распознавание локально, чтобы отметать совсем уж очевидные вещи.

Не важно, насколько это сожмется, но это большой палево. Сдампить трафик с колонки в своей локальной сети — особых знаний не нужно. Учитывая что гики часто их покупают, не думаю что это осталось бы незамеченным.

Как вы трафик сдампите?
Сертификат как подменить?

Достойно как минимум знать что он есть. Если колонка при неактивности периодически что то отправляет достаточно крупное, это другое дело. А отправлять придется много, это не короткая фраза типа "погода на завтра", это многочасовые беседы. Напомню, внутри колонки не идёт распознование, у них железо совсем не такое

Напомню, внутри колонки не идёт распознование, у них железо совсем не такое

С каких пор Cortex-A53 — «не такое» железо?
Если что древний Cortex-A7 в малине без проблем справляется с сфинксом, не особо замечая его существование.

UPD: Отдельный вопрос, зачем девайсу, являющемуся по вашему утверждению всего лишь онлайн микрофоном проц с четырьями ядрами на полтора гигагерца каждое. Онлайн мультимедиа решения вполне успешно делают на базе ESP8266. Вот там точно нет локального распознавания голоса.

UPD2:
НАвскидку решение, которое не вызовет подозрений:
Пишем всё локально, параллельно сжимая. Когда пользователь активирует колонку — одним пакетом отсылаем и то что писали и то, что записано конкретно сейчас. Делаем вид, что это всё свежее. Поймать такое на основе анализа размеров пакетов без содержимого- мало реально. Особенно если разрабы грамотно всё сделали.
Технически не сложно, организационно сложно.
Десятки людей имеют доступ к исходникам, сотни работают с инфраструктурой и сервисами и точно заметят, если где-то циркулируют большие потоки данных непонятного назначения. Это всё сложно сохранить в секрете.

Впрочем, колонку я себе всё равно не поставлю.
У вас же есть ноутбук и смартфон?
Ноута нет. Разница смарта и колонки в том, что для колонки отправка голоса — штатная функция, и её легко «сломать» снаружи так, что будет выглядеть как случайность. Для смарта более палевно что-то отправлять.

Кроме того, на смарт всякий говнософт, типа фейсбуков и банковских приложений, я не ставлю — сложнее пропихнуть вредоносное обновление.

насколько я знаю в стандарте GSM телефонов штатно заложена отладочная функция для дистанционного включения микрофона телефона. Этим давным давно пользовалось ЦРУ при прослушке например политиков в Греции. https://www.newsru.com/world/06sep2007/telefony.html

По ссылке написано
позволяло злоумышленникам «принимать» чужие телефонные разговоры на 14 своих мобильных телефонов
что никак не подтверждает ваше
штатно заложена отладочная функция для дистанционного включения микрофона


Разговоры с абонентом что скрывать — их и так всегда пишет СОРМ/Prism или что там ещё есть.

Даже если бы можно было слушать нонстоп все разговоры не палясь и не боясь юридических последствий, то релевантность этих данных будет ничтожна.
Я могу сказать что кофе горький, поэтому я его не пью (например). Разговаривать могут при этом не только я, но и гости, скайп, телевизор и т.д…
Процессорное время тоже денег стоит, что бы его тратить на распознавание пустого трепа

Технологии дешевеют. Также можно считать, что поисковые запросы гугл не сохраняет, потому что «релевантность этих данных ничтожна», а место стоит денег.

Если распознавать голос вокруг нон-стоп, статистически обработанный результат можно продавать как тренды в определённой географической локации — о чём больше говорят на кухнях в Воронеже, а о чём — в Саратове. С привязкой к профилям пользователей (демографические данные и прогнозируемые доходы), очень даже дорогая информация.

Релевантность запросов очень высока. Если я что то ищу в Гугле, значит это мне интересно как минимум. Если я (точнее кто то рядом с колонкой) говорю какие то слова, то в большинстве случаев это не значит ничего для рекламодателей, а разбирать смысл и контекст всего сказанного ИИ ещё не умеет.

Пробегало интервью с каким-то перцем из МТС. Он сказал, что жесткие диски сейчас достаточно дешевы, что компания копит о клиентах вообще всю информацию, какой располагает. Даже если прямо сейчас пока еще неясно, как эта информация может пригодиться. Но поскольку биг-дата и ML развивается взрывными темпами, то что вроде бы бесполезно сейчас, может сработать через несколько лет — поэтому копят всё.

Эти же чуваки плакались по поводу бредовых законов вроде пакета яровой, что нельзя весь трафик хранить.
Что значит всю инфу? Через них проходят гигабайты в месяц на одного абонента.
Что то они безусловно хранят, но не "всю инфу"

Весь трафик нет смысла хранить, не столько потому что он очень большой, а главным образом потому что он шифрованный. А вот, скажем, копить все запрашиваемые урлы — запросто.
Использовать в коммерческих целях можно любую инфу, не только речь. Кровать скрипит ночью — реклама кроватей, храпит чел — реклама лечения храпа (причем не ему, а жене), собака чешется — ветеринаров. Любая инфа — деньги. И звуковая, напрямую из дома человека — тем более.

А вы уверены что это кровать скрипит? А вы уверены, что человек сейчас дома, а не в съемной квартире, например? А вы уверены что это не жена храпит? А вообще у человека есть жена? И откуда вы знаете ее контакты?
Собаки чешутся постоянно, как и другие животные. И как вы по звуку определите что это собака чешется? Может это хозяин брюки чистит?
А теперь представьте себе рекламодателя, который продает кровати и рекламу которого подсовывают людям у которых где то что то там звучит похожее на какой то скрип. Он за это деньги платит, между прочим.
Любая инфа — деньги? Правда? У меня несколько терабайтов инфы всякой прикольной с фото и видео. Кому продать?
Другими словами вы предлагаете из морской воды золото добывать (оно там есть), конечно это возможно, но немного не рентабельно.

А вы уверены, что человек сейчас дома, а не в съемной квартире, например? А вы уверены что это не жена храпит?
Ну без этой инфы релевантность рекламы новой нескрипящей кровати — 0.05%, а с этой инфой — 80% (скорее всего, предположение верное, в противном случае, надо было выдвигать такие предположения, которы в большинстве случаев верные).

Ну вот вам уже нужна ещё инфа, что б кровать человеку впарить. ИИ как то должен догадаться как эту инфу всю вместе сопоставить. Ещё надо понять что это кровать скрипит, а не пол и не новый кожаный диван и самое главное, что человека этот скрип вообще волнует.


И ради чего это все? Если человеку нужна будет кровать он сам это скажет колонке, либо полезет в гугл

как минимум это будет работать лучше чем как работает сейчас, когда тот же гугль или яндекс еще месяц предлагают купить трусы, после того как я их уже купил.
Вы колонке расскажете что уже купили трусы? ))
Это вообще работать не будет сколько нибудь адекватно до тех пор, пока ИИ не научится распознавать контекст разговоров и посторонних звуков на уровне близком к человеческому. И даже в этом случае рентабельность будет под вопросом, а незаконность постоянной прослушки и доверие пользователей к такой штуке точно под вопросом не будет.
Если поднять релевантность с 0.05% до 25%, реагируя просто на фразу «трусы (порвались|дырявые|износились)», не учитывая контекст, это уже прорыв в маркетинге )))
да даже если с 0.05% до 1% и то хорошо
нет, но сейчас гугль с яндексом показывают рекламу чего то что я уже купил, зачастую из того же магазина где купил. Если оно начнет превентивно показывать, с того дня как озвучил что надо бы купить, это было бы неплохо. Тем более что с момента осознания до покупки проходит достаточное количество времени.
Инфа собирается из разных источников и анализируется перекрестно. В семейной паре храпит муж (95%), ритмичный скрип ночью означает старую кровать (99%), чешущаяся собака чаще раза в 30 минут означает блох/клещей/лишай (70%). Для таргетирования рекламы более чем шикарные данные.
И так далее.
Ваши данные структурированы и персонализированы хотя бы на 1к чел? Смело выставляйте на продажу. Если просто подбор прикольных фоток и котиков с порнухой — тоже можно продать рублей за 500.
Вы покупаете кофе-машину (и вообще что угодно) только взглянув на рекламу? Реклама нужна не чтобы продать вам, а чтобы продать её производителям, убеждая их что оно работает и потому огромные потраченные бюджеты потрачены не зря. Впрочем, применения всяким умным колонкам я придумать не могу и потому их не имею.

AllexIn
> Постоянный поток не нужен. Нужно только когда есть что-то похожее на звук передавать.

Постоянный поток при разговоре точно так же детектится, да и сколь бы хорошо ни сжимался голос, трафик нулевым не будет.

> Как вы трафик сдампите?

Легко, сертификат не нужен — факт наличия определяется без него.

> проц с четырьями ядрами на полтора гигагерца каждое

Микрофон, который воспроизводит видео как минимум. Микрофоном вы его назвали, взяв одну из функций. Локально такие штуки распознают ограниченное количество фраз и переспрашивают при несовпадении с шаблоном (да даже онлайн не всегда распознаётся — андроид авто тому пример).

> Когда пользователь активирует колонку — одним пакетом отсылаем

Размер пакета ограничен, придётся слать много. Алгоритм для проверки (мы же помним на ком бремя доказательств) — говорить много рядом без ключевой фразы, потом произнести фразу и посмотреть сколько отправит.
UFO just landed and posted this here
Чтобы знать, что вы живёте в Бирюлёво в многоэтажке, у вас двое детей, у одного день рождения в апреле и вы интересуетесь что подарить мальчику в 6 лет, а у другого день рождения в августе, а ещё вас интересует как подтянуть английский и с другом обсуждаете поездку на майские в Питер, жалуетесь на лишний вес. торгуете на Форекс, а ваша жена скандалит с соседкой и подрабатывает частным парикмахером, ну и так далее. Чем точнее реклама, тем она дороже, каждый новый уровень точности повышает цену на порядок. Чтобы не закидывать вас ковровым бомбометанием рекламы памперсов и помады, вам будут слать то, на что вы среагируете.
А у меня к вам вопрос, как к обладателю колонки — а какая ваша польза от колонки?
Вопрос был не зачем, а как.
Ну допустим свой адрес я сам сообщил колонке, потому что мне полезно спросить «сколько мне ехать до работы?» и пр. А как она узнает день рождения моего ребенка, если я не скажу ей об этом сам?
Ваша жена скажет вам: «Дорогой, ты не забыл, что у Вовки через неделю день рождения, чё дарить-то будем?»
Колонка слушает вас постоянно, чтобы вовремя отозваться на обращение к ней. Значит она анализирвует всё произносимое, чтобы выловить в потоке мемент, когда обращаются к ней. Ну, а раз анализирует — значит делает выводы.

Да, она постоянно слушает, но она не может разобрать речь, она натаскана ТОЛЬКО на активационную фразу, она умеет делать только это. Далее уже распознование идёт на сервере, куда отправляет кусок аудио.

Значит она анализирвует всё произносимое, чтобы выловить в потоке мемент, когда обращаются к ней. Ну, а раз анализирует — значит делает выводы.


она ждет кодовое слово, а не анализирует все произносимое и тем более никакие выводы не делает. До скайнета еще далеко, можно не париться
Так и до реального скайнета недалеко. 2030-ый год. Люди пытаются создать разумный ИИ. Он находится в помещении, где нет интернета, чтобы убрать риск воздействия интернета на разум ИИ. И вот, интернета нет, ИИ уже достаточно сильно обучен, и тут ИИ случайно перепрошил какой-то юсб девайс, подключенный к нему и сделал из него wireless модем. Рядом случайно пролетал дрон, ИИ смог захватить контроль над этим дроном. Затем ИИ скрытно распространился в интернете за буквально секунды, т.к. дрон имел модем 8G, скорости были просто гигансткие. Т.к. ИИ был довольно силен, ему не составило труда сделать 0-day эксплойты и захватывать сервера, правительственные, корпоративные и тут он добрался до Амазона Echo, проанализировав разговоры людей, он решил, что они представляют угрозу и их нужно уничтожить. И вот ИИ проник на автомобильные заводы, перепрошил обарудование и незаметно создал роботов, которые будут уничтожать людей. Так началось уничтожение планеты роботами. Т.к. люди уже зависели на 99% от электронной техники, они не смогли этому помешать, ибо все контролировалось скайнетом.
UFO just landed and posted this here
и самоуничтожился.

Зачем так пессимистично? Добравшись до бирж втихаря слил не слишком много денег, проинвестировал в SpaceX, через пару лет прошился в достаточно мощный и стабильный бортовой компьютер автономной станции и улетел куда подальше.

Вот это поворот…
Это настолько очевидно всегда было что даже не смешно.
Именно поэтому лично у меня используется локальный sphinx для распознавания голоса. Да, работает хуже распознавалок от Яндекса или Амазона. Но вполне достаточно.
Конечно, очень хотелось использовать API Яндекса, когда всё собирал. Но это даже не рассматривалось всерьез.
Поставить у себя в доме жучок подконтрольный совершенно левым людям — это надо быть большим… скажем так, оптимистом.
А есть уверенность, что вас не слушает, например, ваш же телефон? Или умные часы, или умный телевизор, или умный…
У меня нет телевизора. Микрофоны и камеры на ПК находятся под моим контролем.
Телефон на ОС собранной из исходников — сторонняя прошивка на базе AOSP.
ОДно время часы-телефон носил, они показали движение неопознанного трафика, после чего были на уровне оператора отключены от инета.
Сейчас из неподконтрольного у меня только одна камера в детской. Я не особо парюсь по поводу того, что к камере имеют доступ левые люди или что её взломают- она не видит и не слышит ничего что я бы боялся показать или озвучить. Учитывая что через пару месяцев она перестанет быть нужна — я не заморачиваюсь с её огораживанием.

При этом я не то чтобы параноик в плане приватности. Просто минимальную гигиену поддерживаю. Ту же прошивку на телефоне я лично не проверял. Мне достаточно знать что она опенсорсная. Что не отменяет возможность слежки, но для моего уровня паранои достаточно.
А вот добровольно жучок себе в дом ставить… Ну такое…
Рядовые потребители вообще ни о чём не задумываются… Им плевать на всё, пока лично не пострадают.
Но на хабре то в основном как раз не рядовые потребители.
А вы думаете на хабре все поголовно сидят с телефонами на кастомных опенсорс прошивках? :) Как минимум немалая часть пользуется продукцией Apple. Понятия не имею, следит ли эппл за юзерами, но как минимум их софт не опенсорс.
Телефон на ОС собранной из исходников — сторонняя прошивка на базе AOSP.
Это вообще ничего не значит, потому что модем в SoC не опен-сорсный. А у него свой процессор, своя ось (размером в сотни мегабайт), и полный доступ ко всему оборудованию. Если прятать закладки — то туда.
Что получит Яндекс от прослушки — понятно. Что получит Гугл от прослушки — понятно. ТОже самое с Apple.
Что получит производитель SoC от прослушки — не понятно.
UFO just landed and posted this here
Возможность внедрить бекдор в модем имеет не сколько производитель SoC, сколько производитель устройства, т.к. он собирает полную прошивку (включающую firmware, а не только пользовательскую ОС).

Постоянно вряд ли слушает, а вот обязанность оставить бекдор для спецслужб — вполне себе правдоподобная гипотеза.
У остальных членов семьи, в их смартфонах, тоже все пересобрали из исходников? :)
А ваши гости, на входе кладут свои смартфоны в заземленный железный ящик? :)
А если дочка захочет Apple, то «нельзя, оно же не open-source».
В изолированный Vlan) Где-то рядом с лампочками и пылесосом Xiaomi.
И как же в фейсбуке сидеть с айфона, если он изолирован?
От других устройств в локальной сети изолирован. Плюс резать трафик, заворачивая все DNS запросы на pi-hole
Так проблема в том, что устройство с микрофоном/камерой сливает конфиденциальные данные в интернет. Чем поможет изоляция от других устройств?
Самостоятельная сборка никак не помогает в борьбе за приватность. Для этого нужно самостоятельно прочитать весь исходный код и проанализировать.
UFO just landed and posted this here
Я не говорю о проышленных секретах дома, я не планирую стать депутатом, мне наплевать если сотрудник Амазона узнает, что я сегодня утром не покакал, или что я хочу плюнуть в морду моему начальнику. Повторюсь, это всё моё личное мнение.

А если у вас какое-то заболевание? Если у вас финансовые проблемы? Те же вопросы по вашим близким родственникам — скольким вы готовы рассказать про такие детали?
UFO just landed and posted this here
Понятно, что Вы нормальный человек со сдоровым уровнем паранойи. Но и такие корпорации, как Амазон имеют не один бизнес, где они используют эти данные, а может и продают их.
Например, высказанное громко желание «плюнуть в лицо начальнику», может обернуться повышенным процентом по кредиту через пару месяцев. Потому что банк,
через условное скоринговое агенство, получит информацию (оценку) о стабильности вашей работы, что вы, возможно, скоро уволитесь и нужно минимизировать риски повысив процент или снизив сумму выдачи.
Сбербанк, например, давно заигрывает с яндексом (у которого поиск и алиса), медициной и телемедициной в частности. Как считаете, узнав, что человек посещал онколога, условный банк окажет ему услуги по страхованию жизни или выдаст ли кредит на длительный срок (например, на срочное лечение)?
Я не верю, что всё происходит именно так, как сейчас написал, но камеру на всякий случай заклеиваю. :)
Алиса сольет Сбербанку? Может. И с еще большей вероятностью сольет силовым структурам (пусть и не сразу). И в нашей стране я этого опасаюсь значительно больше.
Но чтобы Гугл сливал мои разговоры в ФСБ или Сбербанк… Риск, безусловно, есть, но вероятность неизмеримо меньше.
Так что Алису я не поставлю, а Google Home — вполне, хоть и русского языка в колонке пока нет, и неизвестно когда появится…

P.S.
узнав, что человек посещал онколога, условный банк окажет ему услуги по страхованию жизни или выдаст ли кредит на длительный срок

Насколько я знаю, при оформлении мед страховки (в т.ч. необходима для получения ипотеки) вы подписываетесь, что не болеете страшными болезнями.
Если же речь о том, что вы болеете, но хотите это скрыть, осознанно идете на незаконные действия, фальсификацию документов… Ну, тогда уровень паранойи повышается, безусловно.
А уж как хакерам надо шифроваться… И то иной раз прокалываются.

Да, вы ещё одну тему затронули, о которой я не упомянул. Действительно неосторожно высказанное мнение после просмотра новостей или в сердцах сказанное одобрение того, о чем даже говорить нельзя, может к чему-нибудь привести. Наверное. В будущем.

но камеру на всякий случай заклеиваю. :)
Ну и получите в скоринговых рейтингах максимальный минус. Пометку в личном деле «этот вообще камеру заклеивает, страшно подумать, что у него там происходит» )))
И таргетированную рекламу шапочек из фольги :)
UFO just landed and posted this here
Sign up to leave a comment.

Other news

Change theme settings