GlobalSign_admin 16 янв 2019 в 08:05

Взлом Amazon Echo и Google Home для защиты приватности

3 мин

24K

Блог компании GlobalSignDIY или Сделай самИнтернет вещейИнформационная безопасность*Raspberry Pi*

+34

129

Комментарии 129

DrZlodberg 16 янв 2019 в 08:27

То есть они сделали свою умную колонку из гугловской/амазоновской выкинув оттдуа оригинальную умную колонку? По описанию именно такое впечатление…

Inanity 16 янв 2019 в 08:37

Нет, они сделали навесной блокиратор, не внося изменений в оригинальное устройство (так то можно было бы микрофоны внутри колонки отключать). Он транслирует запрос, когда слышит своё слов-триггер и шумит в микрофоны колонки во всех остальных случаях.

Эту картинку стоило в статье в явном виде показать

ToSHiC 16 янв 2019 в 21:09

А заодно существенно ухудшили качество распознавания, ведь в оригинальной колонке не просто так несколько микрофонов. Они пытаются формировать «луч», улучшая таким образом показатель сигнал/шум.

sHaggY_caT 16 янв 2019 в 21:27

А никто не знает, существует ли опенсурный аналог, который бы хорошо работал с Linux PC, но подключался не к облаку, а работал локально? Вроде Cortana/Siri, но не Amazon echo на устройстве — что гуглила, вроде заточено на установку на Raspebery Py. А на компе и мощность выше…

Gugic 17 янв 2019 в 04:12

А смысл? Распознование речи — это даже не десятая часть функционала этих колонок. Самое главное там — «natural language understanding» — распознование намерений, так сказать, и диалоговые штуки. Эти колонки локально только wake up word отрабатывают, остальное все происходит на гигантских фермах где-то в облаках при содействии петабайт баз данных. Этого локально не организовать.

Dveim 17 янв 2019 в 11:01

Вот именно это snips.ai (который я ниже упоминал) делает. Полноценное оффлайн распознавание речи, работа на девайсах вплоть до MCU, ну и продвижение с точки зрения «защиты ваших персональных данных».

Disclaimer: я там работаю.

Gugic 18 янв 2019 в 00:58

Потыкал, интересно, спасибо. Можно делать робота с командами «убить всех человеков».

Похоже многое взяли у Dialogflow/Api.ai.

В общем понятна целевая аудитория этой штуки, но есть нюансы. Например у вас очень мало встроенных типов. «Листовых» встроенных типов похоже вообще нет. И как бы ясно конечно что листовые типы любые пользователи могут сами объявлять и что есть волшебное автоматическое расширение, но…

Там куча проблем. Например вы делаете музыкальный проигрыватель для индии. В индии скажем 15 миллионов исполнителей (на самом деле должно быть больше) и у вас даже есть соответствующая библиотека с музыкой. Гл чтобы все работало хорошо — вам нужно всех их загнать в тип и желательно снабдить синонимами (это чтобы разворачивать «RHCP» в «Red hot chili peppers» во время запроса). Какое железо нужно чтобы натренировать модель с этим типом, а какое нужно чтобы поместить ее в память на клиентском устройстве? А если полагаться на авто расширение контекстное то начнутся разные приколы с опечатками, неполными названиями, отсутствием синонимов, путаница с между названиями треков и исполнителями (этого и с соттветствующей разметкой не избежать, конечно).

Встроенные типы тут не спасут, но в менее клиническом случае помогли бы, т.к. они не являются частью непосредственной модели, и их можно очень сильно заоптимизировать. Но опять же — как их в вашем кейсе обновлять? И в целом тут спасет только облако на сегодняшний день.

А небольшие случаи с управлением внутренностями машины или умным домом должны хорошо работать. Было бы качество.

И я так понял — модели тренируются только онлайн?

Дисклеймер:… а ну его.

Dveim 18 янв 2019 в 11:04

Про целевую аудиторию: сугубо с моей персональной точки зрения, это либо те, кому нужна полная автономность (т.е. встраиваемые устройства и десяток-другой команд), либо те, кому хочется потратить свое время и полностью контролировать то, что происходит при голосовых командах.

Есть «магазин приложений», где можно взять уже готовые модели, созданные компанией либо обычными энтузиастами. Как раз пример с музыкой на сегодня существует (не уверен, в публичном ли уже доступе), проиндексировано порядка пары тысяч композиций.

То есть, говоря о втором примере целевой аудитории, предполагается такой конструктор, где можно как собрать всё самому с нуля, так и загрузить уже предоставленное кем-то, что сильно снизит трудозатраты.

Вопрос про обновление, действительно, мне видится самым больным. Работа полностью оффлайн накладывает сильные ограничения. Даже для банального «какая погода сейчас в Париже?» надо иметь доступ к интернету, пусть само NLU и происходит оффлайн. Да и музыку просто так не запустить, даже если точно понять, что именно надо запускать — нужна интеграция с проигрывателем. Работы в этом направлении тоже ведутся, но тут я не могу сказать больше.

Второй козырь (помимо оффлайн работы) — работа с персональными данными. Они никуда не утекут просто потому, что не могут (оффлайн же всё). Насколько это важнее потенциально более удобного использования условной Алексы — решать каждому самому. В моем понимании, «в светлом будущем» Snips видит себя как полноценный игрок на рынке голосовых помощников, за счет магазина типичных приложений, а также интеграции со сторонними железками типа колонок, телевизора, стиралки и тд.

И про тренировку моделей онлайн: сейчас проверяется работоспособность federated learning для распределенного обучения непосредственно на устройствах, proof-of-concept работает.

sHaggY_caT 21 янв 2019 в 23:55

А запилите интеграцию с условной убунтой(мы, сообщество, потом сами запилим пакеты под федоры-арчи-генты итд) и условным гномом?
Ну и howto для юзеров?

Dveim 22 янв 2019 в 17:10

Вот пара примеров:

Там же много более пространных постов о том, как оно всё работает.

sHaggY_caT 23 янв 2019 в 22:19

Спасибо! Первая ссылка не работает

Dveim 24 янв 2019 в 09:49

В смысле не открывается (у меня вроде ок), или какие-то ляпы по ходу гайда?

sHaggY_caT 25 янв 2019 в 01:49

Pardon the interruption.
You’ve read 11 stories this month. Let’s make things official.

Или там регистрация бесплатная?

Dveim 25 янв 2019 в 09:50

Аа, это какое-то нововведение платформы medium. Печально, конечно, нужен тогда другой хостинг для блога.

Без понятия про регистрацию, если честно. В новом private window, наверное, должно открываться.

sHaggY_caT 17 янв 2019 в 23:09

остальное все происходит на гигантских фермах

Вы не забывайте, что на огромную ферму приходится огромное количество юзеров. А мощность десктопов в последнее время (благодаря возвращению AMD на рынок) выросла довольно существенно, и как раз в количестве ядер. Плюс на каждом втором десктопе мощная видеокарта. На ультрабуках, впрочем, наверное, такое и правда будет неудобно запускать — будет включать кулеры и жрать батарейку слабыми U-ядрами

Gugic 18 янв 2019 в 00:34

Мы же о работающем ассистенте сейчас говорим? Частью intent recognition является работа с сущностями, которые в этом интенте теоретически могут присутствовать. Даты, время, коды аэропортов, локации, имена, названия музыкальных групп и фильмов, справочник телефонов организаций в своем и чужом городе, личные предпочтения на аккаунте (как без них реагировать на простое «включи что-нибудь веселое на колонке» — cradle of filth запускать или большого русского босса, или вообще имелся в виду условный акинатор и на какой именно колонке тоже может быть не всегда понятно).

Это все нереальные цифры объема информации, которую надо где-то взять, нормализовать, актуализировать, разметить, поддерживать и перелопачивать при запросе.

Да, там огромное количество юзеров, но это не единственное и не главное препятствие для локального развертывания.

Ну это если про «вроде cortana/siri» говорить. Штуки попроще вроде базового home automation на четыре лампочки и один кондиционер вообще можно безо всякого nlp делать, простыми голосовыми командами (гугл — voice control application pc offline, это не ресурсозатратно).

sHaggY_caT 18 янв 2019 в 02:06

Мы же о работающем ассистенте сейчас говорим? Частью intent recognition является работа с сущностями, которые в этом интенте теоретически могут присутствовать. Даты, время, коды аэропортов, локации, имена, названия музыкальных групп и фильмов, справочник телефонов организаций в своем и чужом городе,

Это может коммюнити предобучать и предъиндексировать, и выкладывать как приложение

личные предпочтения на аккаунте (как без них реагировать на простое «включи что-нибудь веселое на колонке» — cradle of filth запускать или большого русского босса, или вообще имелся в виду условный акинатор и на какой именно колонке тоже может быть не всегда понятно).

А это можно тренировать в фоне, когда ПК не загружен, вместо скринсейвера

НЛО прилетело и опубликовало эту надпись здесь

amarao 16 янв 2019 в 10:04

Они сделали локальный фильтр. Упор на слово «локальный», без передачи звука на сторону.

kahi4 16 янв 2019 в 09:12

Я понимаю, open source и все такое, но недавняя практика использования npm показывает, что было бы желание — просочить вредоносный код можно, а в связи с этим идея выглядит как "перестаньте сливать данные гуглу и амазону, а начните сливать их третьим, неопределенным, лицам". Или я слишком паранойик?

НЛО прилетело и опубликовало эту надпись здесь

geher 16 янв 2019 в 09:47

Вопрос использования чужих программ и устройств всерда упирается в доверие к их создателям. Причем речь не только о злых намерениях, но и о способности создателей предотвратить воплощение в их продукте злых намерений третьих лиц. И это никак не связано с открытостью исходников.
Единственный плюс открытого исходника в этом вопросе — возможность провести аудит кода на предмет закладок и уязвимостей не только спецслужбам.

Кроме того, сливать данные Гуглу и Амазону, как показывает реальная практика, в итоге тоже означает сливать их третьим неопределенным лицам.

Если рассматривать данное устройство, то определенная польза от него все же есть. И риски утечек несколько ниже, чем на голой колонке.
Во-первых, возможен аудит всего кода проекта, включая ОС на RPi (за исключением некоторых вопросов к самой RPi).
Во-вторых, если не оставить устройстау выхода непосредственно в сеть, его взлом будет возможен только при физическом доступе к нему.
Естественно, остаются вопросы потенциальных закладок в RPi и модуле с микрофонами.
Но если без устройства однозначно понятно, что Гуглоамазону сливается все, то с ним есть шанс, что часть времени ничего записано не будет.

DerRotBaron 16 янв 2019 в 22:10

Если я правильно понимаю, эту штуку вполне возможно убрать за фаерволл, который не выпустит её в сеть вообще, а через колонку у неё будут большие проблемы с обратным каналом связи, точнее с очевидностью для владельца его наличия, даже если она сможет через прямой что-то передать.

НЛО прилетело и опубликовало эту надпись здесь

kozar 17 янв 2019 в 10:00

После установки нужного софта, у raspberry можно отобрать доступ в сеть. Даже сменить пароль на точке доступа. Ну или закинуть туда пакеты через SD карточку/по USB. Как он тогда сольёт что-то? Разве что гуглу/амазону ~~настучит~~ нашепчет втихаря от вас. Но если они не в сговоре, то вы все эти запросы в истории того же гугла увидите.

lair 16 янв 2019 в 09:32

Глядя на этот проект, возникает вопрос: а зачем вообще покупать Amazon Echo и Google Home, если распознавание речи выполняется на Raspberry Pi с Tensorflow и Keras?

А много той речи распознает "Raspberry Pi с Tensorflow и Keras" помимо собственного имени?

Miharus 16 янв 2019 в 11:33

Может откликнуться кто нибудь кто эти колонки в реальной жизни использует? Пока что я встречал только случаи, когда кому-то прислали из Штатов, человек поигрался и все. Я просто делаю интернет радиоприемники, без голосового помощника, иногда подумываю, а нужен ли он там?

abyss 16 янв 2019 в 13:37

У меня Google Home Mini с интеграцией в умный дом. В целом умный дом заточен на полную автоматизацию, а голос для оставшегося. По факту в основном использую для выключения света, включения компьютера или робота-пылесоса. В перспективе ещё добавлю включение сцен умного дома, типа режима просмотра с проектора.
Умными фишками не пользуюсь, но тут частично дело в том, что русский ещё не завезли полноценно, а английский неожиданно оказался не особо удобен для меня.
В целом доволен, но просто как ещё один способ управления умным домом.
Про радиоприёмники и прочий фоновый шум: не очень то работает при включенной музыке, т.е. включать можно, но потом проблема. С расстоянием тоже не всё отлично, метра 3 и всё, надо голос повышать, а результат не всегда хороший

Alexious_sh 16 янв 2019 в 14:55

Пользовался связкой Google Home Mini + Chromecast, недавно взял еще Google Home Hub в спальню. Как минимум, оно с успехом выполняет функции мультимедийного комплекса с голосовым управлением. Причем, каждый член семьи получает персональные результаты, на тот же запрос «play music».
Периодически пользуюсь в качестве персонального ассистента, для напоминаний/заметок, а теперь и будильника. Хотя с этим вполне справляется и телефон.
Из умного дома пока только пылесос… съемная квартира накладывает ряд ограничений на возможности интеграции, хотя уже подумываю над поиском решений)

kAIST 16 янв 2019 в 15:55

Мне жена подарила irbis с Алисой, а потом отобрала на кухню )
Музыку удобно ставить, что нибудь спросить, таймер поставить и пр. Теперь хотим уже Яндекс станцию в гостиную.

kost 16 янв 2019 в 17:32

Все знакомые пользуются (в США).
Дети знакомых просят Alexa поставить музыку, например.

У меня лежат Amazon Echo и Google Home Mini — не подключаю, паранойя.

kobiak 16 янв 2019 в 21:02

Отличный девайс для рутин:
— пришел домой, заиграла музыка
— ушел, музыка перестала играть
— попросить играть музыку (тут еще дело в подписках к примеру на youtube premium)
— таймер
— найти рецепт
— включить быстро youtube на тв какой либо ролик
— рассказать погоду по моему маршруту на работу (я на велике 16 км езжу)

это лишь то, что я использую каждый день.

Alexious_sh 16 янв 2019 в 21:07

— пришел домой, заиграла музыка
— ушел, музыка перестала играть

Как такое реализовать? Или имеются ввиду встроенные рутины, активирующиеся по голосовым командам?

kobiak 16 янв 2019 в 21:12

встроенные рутины + у меня home assistant и device_tracker, которые отслеживают мой телефон по двум параметрам (подключился к wi-fi и bt)

Mobile1 17 янв 2019 в 03:51

Как такое реализовать? Или имеются ввиду встроенные рутины, активирующиеся по голосовым командам?

Вроде есть такой скилл в связке через IFTTT

Mobile1 17 янв 2019 в 04:08

Я просто делаю интернет радиоприемники, без голосового помощника, иногда подумываю, а нужен ли он там?

В Алексе есть куча радиостанций — через Tunnln, еще какие-то сервисы там есть.
Просто говоришь какое радио включить и все.
Есть русские станции.
Поэтому Алекса — конкурент и интернет-радиоприемникам, за счет легкого управления голосом.

boblenin 17 янв 2019 в 15:33

Мы используем Alexa. В качестве игралки музыки, будильника, напоминалки, таймера, интеркома, телефона.

CryptoPirate 16 янв 2019 в 11:55

Глядя на этот проект, возникает вопрос: а зачем вообще покупать Amazon Echo и Google Home, если распознавание речи выполняется на Raspberry Pi с Tensorflow и Keras? Разве что в качестве подставки…

На устройстве обычно распознается только слово триггер, а не любая речь.

nafikovr 16 янв 2019 в 12:35

ну прикрутить тот же яндексовский api и радоваться жизни, не?

lair 16 янв 2019 в 12:48

И радоваться тому, что данные сливаются в яндекс, а не в амазон/гугл? Ну да, хороший выигрыш.

(кстати, какой конкретно яндексовский API?)

nafikovr 16 янв 2019 в 12:52

Ну да, хороший выигрыш

выигрыш в том, что при прочих равных не нужно покупать эхо в качестве подставки.

lair 16 янв 2019 в 13:01

Это если "прочие" — равные, в чем пока нет уверенности.

nafikovr 16 янв 2019 в 13:40

напомню вопрос, зачем нужна подставка в виде эхо/хоумпода, в случае описанном в статье, когда есть распбери.

lair 16 янв 2019 в 13:43

… затем, что у эхо/хоум больше функциональности, чем у описанной в статье малинки?

nafikovr 16 янв 2019 в 14:42

а что, стороннее приложение не может отправлять запросы той же алексе?

lair 16 янв 2019 в 15:07

Насколько я знаю — нет, не может.

nafikovr 16 янв 2019 в 17:21

вот тут что то есть
circuitdigest.com/microcontroller-projects/raspberry-pi-amazon-echo

lair 16 янв 2019 в 17:46

Вы шлете туда голос. Поэтому все проблемы конфиденциальности данных остаются (ну разве что вы немножко лучше контролируете, когда она включается). Плюс, вы не можете пользоваться этим сервисом просто так, вам нужно партнерство с Амазоном — и это вряд ли дешевле, чем просто купить Echo.

nafikovr 16 янв 2019 в 19:01

а девайс из статьи не шлет туда голос?

lair 16 янв 2019 в 19:17

Малинка? Нет, не шлет. Сама умная колонка — шлет, конечно.

Но непонятно, в чем выигрыш, если пользоваться тем же самым сервисом.

Wesha 16 янв 2019 в 22:35

Выигрыш в том, что обычно злые дяди из трёхбуквенного агентства могут вежливо попросить Амазон удалённо включить микрофон Вашего устройства, и писать все звуки в вашем доме подряд — например, как Вы с женой обуждете устройство суперсекретного бульбулятора с лазерной накачкой, — а не только Ваши поисковые запросы. А "грибок" служит фильтром: когда узнаёт ключевое слово — пропускает следующие надцать секунд звука на ~~Юстасу~~ Алексу, а всё остальное время прилежно шипит в её микрофоны.

(Кстати, интересный вопрос — а не обвалит ли десяток часов белого шума амазоновские сервера?)

lair 17 янв 2019 в 05:52

А "грибок" служит фильтром: когда узнаёт ключевое слово — пропускает следующие надцать секунд звука на Юстасу Алексу, а всё остальное время прилежно шипит в её микрофоны.

Вы сейчас объяснили, в чем выигрыш от использования грибка, но не самодельного устройства.

Кстати, интересный вопрос — а не обвалит ли десяток часов белого шума амазоновские сервера?

Неа, не обвалит. Почему бы?

nafikovr 17 янв 2019 в 06:20

на самодельном устройстве никто не мешает сделать программный «грибок», который будет пропускать через себя стрим с микрофонов только в определенных случаях

lair 17 янв 2019 в 08:19

… и через недельку-другую обнаружить, что ваше устройство заблокировано в AVS за нарушение Program Terms (причем не важно даже, есть там такой дословный пункт, или нет)

nafikovr 17 янв 2019 в 08:38

обоснуете?
заодно ответьте на вопрос чем программное отключение микрофона принципиально отличается от варианта упомянутого в посте? кстати в amazon echo есть выключатель микрофона.

lair 17 янв 2019 в 08:41

обоснуете?

А чем обосновывается утверждение "злые дяди из трёхбуквенного агентства могут вежливо попросить Амазон удалённо включить микрофон Вашего устройства, и писать все звуки в вашем доме подряд"? Вот и мое предположение, что Амазон может отключить неудобного ему пользователя сервиса (особенно если этот пользователь ничего не платит), основано приблизительно на том же.

заодно ответьте на вопрос чем программное отключение микрофона принципиально отличается от варианта упомянутого в посте?

Тем, что автор самопального устройства, используя AVS, обязан соблюдать Terms and Conditions разработчика, а владелец — Terms and Conditions пользователя.

nafikovr 17 янв 2019 в 08:55

Тем, что автор самопального устройства, используя AVS, обязан соблюдать Terms and Conditions разработчика, а владелец — Terms and Conditions пользователя.

вот только в обоих случаях на микрофон не будет поступать «полезной информации», так что разницы нет.

lair 17 янв 2019 в 08:57

Нет разницы для кого и в чем? В механизмах воздействия Амазона на "пользователя" — есть.

nafikovr 17 янв 2019 в 09:00

допустим амазон дает команду «включить прослушку» и в обоих случаях получает не прослушку, а условный белый шум.

lair 17 янв 2019 в 09:02

Вот только в том случае, если это "честная" Алекса, он ничего особо больше сделать не может, а в случае, если это самопальный девайс — отключит девайс к чертям, вместе с эккаунтом разработчика, и все. Чтобы неповадно было. Амазону-то одинаково, он в обоих случаях ничего не получил, а вот пользователю девайса — больно.

НЛО прилетело и опубликовало эту надпись здесь

lair 17 янв 2019 в 09:16

У амазона сервисы для speech recognition и natural language understanding (Lex, Polly, Transcribe) открыты для всех

Вот только не бесплатны.

вы можете сделать свою умную колонку с блекджеком уже сейчас

… и сколько времени и усилий понадобится на то, чтобы повторить уже существующую функциональность Алексы? Особенно в части интеграции с другими устройствами?

Речь же не о том, что это принципиально невозможно — речь о том, насколько просто заменить Alexa Echo или Google Home в нормальном использовании.

НЛО прилетело и опубликовало эту надпись здесь

lair 17 янв 2019 в 10:07

Нет, а должны?

Да нет, просто надо не забывать включать эту стоимость в расходы на свое решение.

но попробую ответить — вы можете сразу строить аналоги «alexa skills»

Мне не нужно строить аналоги, мне нужно, чтобы существующие работали. Чтобы далеко не ходить, вот стоит у меня на кухне Anova Precision Cooker, который прекрасно работает через Google Home и Alexa. Что мне нужно сделать, чтобы все то же самое заработало из моей самописной умной колонки? Или, допустим, я хочу, чтобы моя умная колонка понимала команды, связанные с моей учеткой в Google Music (типа "play radio Wood Works") — как это сделать?

Построить диалоговый интерфейс — (сравнительно) несложно. Сложно сделать небессмысленную интеграцию.

отличный прогресс, вы не находите?

Нахожу.

nafikovr 17 янв 2019 в 10:25

Что мне нужно сделать, чтобы все то же самое заработало из моей самописной умной колонки?

лишь сделать так, чтоб эта умная колонка работала с сервисами Alexa (ну или гуглхоум). Дальше Alexa сама все сделает, так же как и если бы команда поступила от Echo.

lair 17 янв 2019 в 10:26

лишь сделать так, чтоб эта умная колонка работала с сервисами Alexa

Что противоречит предложению выше по треду использовать сервисы ASR/NLU без использования Алексы.

Колонка, работающая с сервисами Алексы, обязана соответствовать требованиям этих сервисов, а это не то, чего бы хотелось параноику, который заглушает микрофон на колонке белым шумом.

nafikovr 17 янв 2019 в 10:38

а где то есть доказательства того что другие сервисы амазона не будут так же передавать данные если их запросят?

lair 17 янв 2019 в 10:43

Нету их нигде, понятное дело.

nafikovr 17 янв 2019 в 13:00

ну значит и профита нет. значить нужно лишь не быть параноиком и считать что никому твои данные не сдались. ну разве что пойдут в обучение

lair 17 янв 2019 в 13:02

ну значит и профита нет

Ну вот и я говорю, что профита нет.

значить нужно лишь не быть параноиком и считать что никому твои данные не сдались

А вот тогда можно просто купить Echo и не страдать фигней. О чем и была речь изначально.

Wesha 17 янв 2019 в 20:20

считать что никому твои данные не сдались.

Вы забываете про фактор времени.

Вчера школьные фотографии Вовочки действительно никому нафиг не сдавались. А вот сегодня...

А теперь представьте, что к некоторому Васечке через 20 лет подходят добрые дяденьки с нерусским выговором, показывают ему пачку фотографий с корпоратива 25-летней давности, на которых он спит спокойно с лицом в торте, и вежливо интересуются, что он готов сделать, чтобы эти фотографии не попали в руки его противников по избирательной компании на некий государственный пост.

Wesha 17 янв 2019 в 20:14

программный «грибок», который будет пропускать через себя стрим с микрофонов только в определенных случаях

Ну, Вы как хотите, а я себе буду делать только хардкор, только аппаратный выключатель, разрывающий ~~пасть льву~~ цепь.

Wesha 17 янв 2019 в 20:12

Кстати, интересный вопрос — а не обвалит ли десяток часов белого шума амазоновские сервера?
Неа, не обвалит. Почему бы?

Чукча не ~~читатель~~ по-ссылкам-ходитель?

lair 17 янв 2019 в 20:21

Да не, чукча просто считает, что такие смешные ошибки случаются реже, чем хотелось бы.

Wesha 17 янв 2019 в 22:26

У меня для Вас плохие новости: согласно моему опыту, всё ещё хуже.

lair 18 янв 2019 в 08:40

То есть оно еще реже происходит, чем мне бы того хотелось?

Wesha 18 янв 2019 в 19:55

"Если бы строители строили здания так же, как программисты пишут программы, первый залетевший дятел разрушил бы цивилизацию."

nafikovr 16 янв 2019 в 17:26

вообще странно, если нет доступа для сторонних приложений, так как ключевой продукт сервис, а не железка, которая дает к нему доступ

lair 16 янв 2019 в 17:47

Для кого ключевой продукт "сервис"? Для Амазона? Я бы не был так уверен. На железках проще зарабатывать.

nafikovr 16 янв 2019 в 19:13

железку вы продаете один раз. а от сервисов получаешь деньги постоянно. когда кто то через алексу заказывает пиццу, вызывает такси, слушает музыку по подписке и тп, амазон получает свою копеечку. чем больше девайсов работают с алексой, а не с гугл ассистентом/алисой — тем лучше амазону.

lair 16 янв 2019 в 19:20

Вопрос в том, насколько эти копеечки окупают сервис — особенно учитывая, что подписочные сервисы (типа Prime Video) прекрасно работают и без алексы.

Wesha 16 янв 2019 в 22:37

Стотыщмиллионов копеечек лучше, чем миллион долларов.

lair 17 янв 2019 в 05:52

Только если эти копеечки есть.

nafikovr 17 янв 2019 в 06:26

вы всерьез думаете что продавая подобный девайс за ~$100 можно заработать что то кроме тех же копеечек?

lair 17 янв 2019 в 08:19

Я всерьез думаю, что пока нет цифр от амазона, сложно что-то утверждать. В частности — по моему личному опыту — поддерживать публичный сервис ощутимо дороже, чем просто продавать железки, которые работают с закрытым сервисом.

nafikovr 17 янв 2019 в 10:06

ну да, закрытый сервис. заходим в плеймаркет и ставим алексу на любой телефон с андроидом. с иос думаю ситуация та же.

lair 17 янв 2019 в 10:08

Я не говорил, что Алекса — закрытый сервис, я говорил, что публичный сервис дороже в поддержке.

Mobile1 17 янв 2019 в 03:53

nafikovr
вчера в 17:42
0 а что, стороннее приложение не может отправлять запросы той же алексе?

lair
вчера в 18:07
Насколько я знаю — нет, не может.

Ну как это не может?
Мы давным давно встроили Алексу в мессенджер, даже статья об этом на Хабре есть:
Управляем сотнями разных устройств умного дома голосом и текстом со смартфона. Alexa Echo в мессенджере

lair 17 янв 2019 в 05:51

Ну значит, я был не прав. Три вопроса, тем не менее:

Вы интегрируетесь с Alexa Voice Service, или каким-то другим сервисом?
Вы действительно можете вести диалог с Alexa текстом, а не голосом?
Есть ли у вас письменное разрешение от Амазона на распространение вашего "мессенджера с Alexa" на территории России?

Mobile1 17 янв 2019 в 09:35

1. Вы интегрируетесь с Alexa Voice Service, или каким-то другим сервисом?

Конечно, напрямую с AVS, ведь он изначально открыт и бесплатен для разработчиков. Амазон поощряет, постоянно проводит вебинары…

2. Вы действительно можете вести диалог с Alexa текстом, а не голосом?

Да, конечно.
Вы и сами можете убедится с этом скачав и установив наш мессенджер.
А в вышеупомянутой статье написано как делается текст.

Сейчас поддержка Алексы только на Андроиде и iOS, десктопы еще не сделали.
Мы кстати и Алису обучили всем навыкам Алексы — вот статья об этом:

От лампочки до пылесоса и дрона — как мы научили Алису управлять сотнями устройств

3. Есть ли у вас письменное разрешение от Амазона на распространение вашего «мессенджера с Alexa» на территории России?

Да, конечно, за подписью самого Безоса. Показать?

lair 17 янв 2019 в 10:00

А в вышеупомянутой статье написано как делается текст.

Я вот пошел и прочитал эту статью третий раз, но так и не нашел в ней рассказа про то, как это делается — только скриншоты интерфейса, и даже с этой оговоркой там есть только "часто вызываемые команды", а не полноценный диалог.

С помощью какого API AVS вы делали текстовый диалог с пользователем?

Мы кстати и Алису обучили всем навыкам Алексы — вот статья об этом:

Ссылка ведет на список ваших статей, а не на конкретную статью. И здесь мне тоже интересно, как вы программно вызываете Alexa Skills, учитывая что Skill Messaging API требует поддержки со стороны скила.

Да, конечно, за подписью самого Безоса. Показать?

Да, пожалуйста.

Mobile1 17 янв 2019 в 11:31

А в вышеупомянутой статье написано как делается текст.

Я вот пошел и прочитал эту статью третий раз, но так и не нашел в ней рассказа про то, как это делается — только скриншоты интерфейса, и даже с этой оговоркой там есть только «часто вызываемые команды», а не полноценный диалог.

Там просто в том же окне набираете команду для алексы и все.
Как объяснить, я даже не знаю…
Вот вы мессенджером каким-нибудь пользуетесь?
Вы пишите в определенном поле слова — верно?
Так же и здесь:

Вот там где введите поисковый запрос, туда команду надо ввести и нажать маленькую иконку микрофона справа (естественно предварительно подключив аккаунт) — мне кажется что там все предельно понятно…

А статья про Алису вот:
habr.com/ru/company/mobile_one/blog/419467
Но в самом блоге она тоже есть, почему-то неправильно ссылка присоединилась…

lair 17 янв 2019 в 11:32

Так же и здесь:

А где ответы Алексы в текстовом виде? Как выглядит multi-turn interaction?

мне кажется что там все предельно понятно…

Одно непонятно (и я этот вопрос уже задавал, могу повторить): через какое API вы шлете AVS текстовые команды и получаете текстовые ответы?

А статья про Алису вот:

Таки я пошел и прочитал, и мой вопрос остался неотвеченным: как вы программно вызываете Alexa Skills?

Mobile1 17 янв 2019 в 11:49

API используется стандартный, зарегестрируйтесь на Амазоне как девелопер и у вас такой же будет и вы точно также сможете свой софт ваять, нет никаких левых методов…

lair 17 янв 2019 в 11:55

API используется стандартный

А конкретнее? Можете показать, какой метод вы вызываете? А то я даже интерфейса подходящего найти не могу.

Mobile1 17 янв 2019 в 12:22

Нет, не могу.
Именно с текстом провозились, хотя сейчас это может быть легче.
Все там есть, ищите, делайте.
Мы не опенсурс проект.

P.S. Зарекался на Хабре комменты не писать, но по Алексе не выдержал.
Результат не заставил себя ждать — минусы в комментах.
Я принципиально никому на хабре не поставил ни одного минуса, а тут даешь инфу, тебя еще и минусуют, мда…
Тут вообще вопросы у товарищей такого плана:

— Дайте воды попить, а то так жрать хочется что переночевать негде…

Это же вы и ставите, lair?
Больше-то некому, эту статью уже никто не читает.
Что за народ…
lair, забудте про все что я тут говорил, пусть будет по вашему:

вчера в 18:07
Насколько я знаю — нет, не может.

В вашей системе координат не может, да и не нужно вам оно…

lair 17 янв 2019 в 12:25

Я не прошу ваш код, я прошу ссылку на метод в публичной документации. Не хотите давать ссылку — верить вашему утверждению, что такая интеграция легкодоступна и стандартна, я не буду, особенно учитывая, что это противоречит моим собственным изысканиям.

а тут даешь инфу

В том-то и дело, что вы не даете инфы, только обтекаемые фразы "мы сделали".

Mobile1 17 янв 2019 в 13:47

Слушайте, увОжаемый, я вам ничем не обязан.
Вы сказали фигню — я вас поправил и указал на рабочий пример, на этом все.
Вы начали нести бредятину насчет писем на разрешения (как вы вообще до этого додумались, а?) а закончили тем что стали в позу обженного, потому что я не ткнул вам ссылкой в одно место.

С каких дел я вам должен что-то доказывать?
У нас есть рабочий продукт, который вам западло посмотреть, вы тут выпендирваетесь по полной программе, и думаете что я поведусь на такой стиль общения?

Спрошу с таким же подколом, как и вы — если вы сами в открытой документации не можете ничего найти, то может быть вы просто такой специалист?

lair 17 янв 2019 в 13:52

Вы сказали фигню — я вас поправил и указал на рабочий пример, на этом все.

"Рабочий пример" как слать в алексу голос обсудили еще до вашего прихода; ваше решение интересно только заявкой "мы шлем в алексу текст/запускаем в алексе скиллы"… которую вы непонятно, каким святым духом делаете.

Вы начали нести бредятину насчет писем на разрешения (как вы вообще до этого додумались, а?)

ToS прочитал внимательно.

С каких дел я вам должен что-то доказывать?

Не должны. Но и верить вашим утверждениям, что это возможно, я тоже не должен.

У нас есть рабочий продукт, который вам западло посмотреть

Дайте инстанс, которым можно воспользоваться без регистрации в вашей системе — тогда и посмотрим.

Спрошу с таким же подколом, как и вы — если вы сами в открытой документации не можете ничего найти, то может быть вы просто такой специалист?

… или там этого просто нет. Учитывая количество публично доступных вопросов "как это сделать" с ответом "возьмите TTS" я склоняюсь к варианту "этого там нет, так сделать нельзя" (а у вас — TTS).

Mobile1 17 янв 2019 в 14:18

Вы сказали фигню — я вас поправил и указал на рабочий пример, на этом все.

«Рабочий пример» как слать в алексу голос обсудили еще до вашего прихода;

О, господи, вы еще и факты перевираете.
Вы сказали буквально следующее:
«nafikovr
yesterday at 05:42 PM

0
а что, стороннее приложение не может отправлять запросы той же алексе?
Reply
lair
yesterday at 06:07 PM

–1

Насколько я знаю — нет, не может.

Т.е. вы вообще не в теме того что любой производитель железа или софта может слать запросы Алексе.
Тут, понимаете на Алиэкспрессе не найдешь китайских лампочек от любого нонейма, которые не умеют в Алексу, а у вас — не может.

Не должны. Но и верить вашим утверждениям, что это возможно, я тоже не должен.

Какие утверждения?
Это у нас работает с 2017 года уже.
Но вы можете не верить, видимо у вас своя реальность, в которой мы не существуем.
Живите в этой реальности и дальше, вы видимо непробиваемый.
И к тому-же меркантильный и мелочный- ставите втихаря мне минусы.
Я вам ставить их точно не буду, не беспокойтесь, но и общение прекращаю.

lair 17 янв 2019 в 14:27

О, господи, вы еще и факты перевираете.

O'RLY?

lair 17.01 18:07 Насколько я знаю — нет, не может.
lair 17.01 20:46 Вы шлете туда голос.
Mobile1 18.01 06:53 Ну как это не может?

Более того, я еще и вам прямо написал:

lair 18.01 08:51 Ну значит, я был не прав

Тут, понимаете на Алиэкспрессе не найдешь китайских лампочек от любого нонейма, которые не умеют в Алексу,

Вы точно не путаете AVS Device/Product и Alexa Connected Devices?

Это у нас работает с 2017 года уже.

Вопрос, собственно, в том, какое "это" у вас работает. Отправка голоса? Ну да, я еще вчера признал, что так можно. Отправка текста?.. Прямой вызов скиллов?..

Buzzzzer 16 янв 2019 в 13:45

Чтобы без колхозинга управлять экосистемой Эхо/Хоум?

xlop-chik 16 янв 2019 в 12:00

блин, я думал что они свою разговаривающею колонку сварганили… так нет же, только надстройку -фильтр с отсекатилем отправки данных в сервис гугла и амазон… мало того так и распечатанная крышка убогая. авторы сидят на тяжёлых наркотиках?
а почему до сих пор нет опенсорсного проекта по созданию говорящей колонки? да и зачем колонка? лучше сразу ПК!
я бы не против, что бы мой пк мог озвучивать тексты нормальным и приятным! русским! голосом… мог по моей команде открыть и поставить на воспроизведение выбранный мной фаил… наконец просто запустить консоль и печатать в ней озвученные мной команды и ставить их на выполнение. прогу можно было бы сделать модульной — и каждый мог подобрать нужные для него функционал.
но увы мы этого никогда не увидим. а всё потому, что мало зоопарка линексов и браузеров — нужно соорудить очередной велосипед. нет чтобы сосредоточится на действительно нужном проекте. даже досих пор не имеем опенсорсной видухи или проца который не уступал бы именитым брендам, а чтобы превосходил их… но увы, мечты, мечты.

lair 16 янв 2019 в 12:12

Так что же вам мешает все это сделать и опубликовать исходники?

xlop-chik 16 янв 2019 в 17:47

наверное то что я не программер, а электрик.

lair 16 янв 2019 в 17:48

Вот поэтому и нет "опенсорсного проекта".

Paskin 16 янв 2019 в 14:06

Есть опенсорсный Mycroft.ai

putnik 16 янв 2019 в 15:07

(deleted)

putnik 16 янв 2019 в 15:09

Спасибо за ссылку на Mycroft.ai, не знал о таком. В ближайшее время попробую сделать себе на малинке. Если получится что-нибудь интересное, может даже пост напишу.

(Промахнулся ответом Paskin)

Arevik 16 янв 2019 в 17:29

Посмотрите тогда и на github.com/shivasiddharth/Assistants-Pi
А еще существует такой проект openassistant.org

Dveim 16 янв 2019 в 18:05

И добавлю про существование snips.ai

geisha 16 янв 2019 в 16:23

Для установки понадобятся: одноплатный компьютер с операционной системой Raspbian, достаточно Raspberry Pi A+;

Люди эту хрень в космос запускают, а тут надо пошуметь в динамики да определить ключевое слово. Мало того, что из пушки по воробьям, так ещё и стоимость компонентов сравнима с Echo.

Squoworode 16 янв 2019 в 17:12

А на чём надо было? На Ардуино? Или предлагать каждому пользователю спаять собственный одноплатник?

geisha 16 янв 2019 в 18:50

В идеале — джейлбрейк Echo или просто поставить Android на raspberry pi и пользоваться всеми преимуществами.

Mobile1 17 янв 2019 в 04:02

Alexa Echo изначально можно запустить на любом одноплатном компьютере.
У Амазона такой подход сразу был — все, что имеет микрофон и спикер, может быть превращено в Алексу.
И вот там можно играться микрофонами и с ключевыми словами.
Поэтому полноценную Алексу -колонку можно легко делать и на Ардуино и на raspberry — никто этого не запрещает, таких реализаций вагон.

lair 17 янв 2019 в 05:53

И вот там можно играться микрофонами и с ключевыми словами.

"you will not use or allow the use of any wake word or other trigger word as part of accessing the Alexa Service in your AVS Products other than the wake or trigger words authorized by Amazon (currently "Alexa");"

https://developer.amazon.com/support/legal/alexa/alexa-voice-service/terms-and-agreements

id_potassium_chloride 16 янв 2019 в 19:04

Ненадёжно всё равно: если шум пишется, то из него всё равно можно вытянуть информацию. Мне кажется, надо разбирать колонку и вкручивать в неё выключатели микрофонов.

nafikovr 16 янв 2019 в 19:18

вы не поверите. она там есть изначально.

Stepan555 16 янв 2019 в 19:31

А не проще ли и не умнее ли просто не покупать за свои деньги фигню, единственное назначение которой — шпионить за тобой?

Bobnecat 16 янв 2019 в 21:33

Ничего, Гугл и Амазон скоро додумаются «лишнюю дырочку» просверлить где-нибудь под колонкой и продолжат слушать как раньше.

REPISOT 17 янв 2019 в 03:31

Взлом Amazon Echo и Google Home

Взлом? Где взлом? Это что, неудачный перевод заголовка?
Ожидал реальный взлом, что-то вроде получение рута или админки и отключения следилок, а тут…

Zanak 17 янв 2019 в 06:05

Сначала мы встраиваем камеру в ноутбук, потом ее заклеиваем.
Смартфоны — это уже набившая оскомину тема.
СмартТВ тоже подозреваем в шпионаже.
Недавняя история с аппаратными закладками, опять же.
Теперь вот с ассистентами тоже самое.
Одному мне это кажется странным? Сами испугались того, что напридумывали?

coramba 17 янв 2019 в 12:02

Скорее всего дело в «мы» и «они».
Мы-потребители, хотим удобных фишек предлагаемых новыми технологиями, но не хотим платить за это приватность.
Они-производители, хотят зарабатывать как можно больше денег, и не хотят ограничиваться только продажами железа, которые приносят куда меньше дохода, чем личные данные.
И вот начинается игра в перетягивание каната с заклеиванием камеры и подсовыванием трекинг кук.

Wesha 17 янв 2019 в 20:29

> Сначала мы встраиваем камеру в ноутбук, потом ее заклеиваем.

Я бы с удовольствием купил ноутбук без камеры, но не могу.

Gugic 18 янв 2019 в 19:41

Кстати, новый Asus Zephrus S (GX701) идет без встроенной вебкамеры. Захочется ли вам его купить — вопрос конечно. В продажу пока не поступил, цена неизвестна.

coramba 17 янв 2019 в 10:01

Если нашлепку еще и покрасить под хед-краба или просто распечатать в пластике телесного цвета, то будет весьма символично, хоть и немного пугающе.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий