SLY_G Mar 13 2016 at 20:58

Восстание машин: Amazon Echo начал выполнять команды, услышанные по радио

1 min

13K

Artificial Intelligence

+10

Comments 44

SnowLoKu Mar 14 2016 at 05:19

Учитесь у детей, у некоторых давно защита от этого есть, им нужно по три раза повторять одно и тоже.

mukizu Mar 14 2016 at 07:08

Три раза нельзя — Майкл Китон появится.

AleBas Mar 15 2016 at 07:41

Мне кажется, что яндекс навигатор уже пользуется данной функцией.

igruh Mar 14 2016 at 05:47

Убить всех человеков! (с)

mihailfilatov Mar 14 2016 at 06:32

Аналогично реагирует яндекс.навигатор, когда его упоминают по радио

ruikarikun Mar 14 2016 at 12:10

Достаточно упомянуть в разговоре ИНДЕКС или КОДЕКС.

rd_nino Mar 14 2016 at 08:14

Странно, что в устройстве не предусмотрели идентификацию хозяина по тембру голоса (или как там это организовано?).

reefer Mar 14 2016 at 08:52

ну это устройство позиционируется как больше семейный помощник, а не как сири.

potan Mar 14 2016 at 12:27

Возможно, это снижает стабильность распознавания.

edwardspec Mar 14 2016 at 08:17

От этого существует слово активации ("ok, glass — take a photo", "Siri make me a sandwich"), без которого он не будет реагировать на команды.

Если слово произнесли случайно, но в течение N минут команд не поступило, то прекращать ожидать команды (пока слово активации не скажут снова).

он не смог прослушать историю о помощнике до конца, так как когда его помощник услышал своё имя

Это сложнее, ведь после имени помощника могут произнести примеры команд.
Возможное решение — пользователь сам выбирает слово активации (заставить изменить слово по умолчанию через 30 дней после покупки, как пароли).

hdfan2 Mar 14 2016 at 08:34

Так, видимо, по радио так и говорили: «Достаточно сказать: „Alexa, сделай то-то“, и оно вам это сделает» (у Amazon Echo, если я правильно понял, активируется так), т.е. произнесли фразу со словом активации.

edwardspec Mar 14 2016 at 08:39

Вот я и предлагаю, чтобы пользователь давал своему устройству кличку.
Чтобы было не "окей глас, сделай фотку", а "Тузик, сделай фотку".

hdfan2 Mar 14 2016 at 08:50

А, извиняюсь, не дочитал. Да, было бы логично, но как это распознавать? Я так понимаю, что сейчас эта штука в оффлайне умеет распознавать только кличку, а остальное распознаёт через инет. А распознавать произвольное слово, которым захочет его называть пользователь, у ней мощи не хватит.

edwardspec Mar 14 2016 at 09:44

Человек выбирает кличку помощника, произнося её вслух.
Сохранить эту запись (1-2 секунды) локально. А потом сравнивать с записью.

ProLimit Mar 14 2016 at 10:58

Локально можно распознавать ограниченный набор слов. а не только одно заранее заданное. Так что думаю можно будет переобучить на новое, уогда будет поддержка в софте.

LazyCrazy Mar 14 2016 at 15:41

Давным-давно старые, "не умные", маломощные телефоны запросто справлялись с распознаванием [заранее записанных] имён в адресной книге — в любом современном устройстве явно это можно реализовать — было бы желание разработчиков [не привязывать всё к интернет]...

reefer Mar 14 2016 at 16:03

у нее есть еще пара-тройка слов-активаторов, которые можно использовать без любых танцев. вот только подавляющее большинство не пользуются этой возможностью.

Alexsandr_SE Mar 15 2016 at 07:15

Сименс М55 был, голосовой набор (предварительно обучение) распознавал даже в маршрутке шумной без проблем.

xut Mar 14 2016 at 08:45

Darth_Biomech Mar 14 2016 at 08:56

А как у софта ныне с определением звучания голоса (В смысле, вообще в этой области, не конкретно у помошников)? Можно добавить функцию, при которой помощник будет импринтиться на голос хозяина, и соответственно игнорировать все остальные.

UFO landed and left these words here

Abiboss Mar 14 2016 at 12:04

Гораздо выгоднее будет «Окей, Алекса, отправь смс на номер 4422», предварительно зарегистрированный на свое имя

Gorodnya Mar 14 2016 at 12:49

У клиентов Capital One и Lloyds Bank будет и такое: https://geektimes.ru/post/272576/#comment_9095506

LazyCrazy Mar 14 2016 at 10:50

Планшет стоит в док-станции рядом с компьютером. Не очень часто, но довольно стабильно, при просмотре на компьютере новостей с выставок и презентаций по youtube планшет радостно реагирует на "Ok, google!", сказанное в ролике. Наверное, почти каждый сталкивался с ситуацией, когда "возбуждается" несколько android-устройств, находящихся в пределах слышимости. Причём, если несколько устройств принадлежат одному владельцу — надо делать "персонализацию" устройств, а не персонализацию владельцев в вызовах.

UFO landed and left these words here

Alexious_sh Mar 14 2016 at 15:10

Распознавание фразы "OK, Google!" с любого экрана дополнительно включается в настройках Google Now, и поддерживается не на всех устройствах. Плюс есть еще распознавание при заблокированном экране, которое работает на еще меньшем количестве устройств...

LazyCrazy Mar 14 2016 at 15:34

Абсолютно верно. Речь шла об Nexus 7 (2013) Wi-Fi с прошивкой 6.0.1 и настроенном, как вы описали, Google Now — поскольку большей частью он живёт на рабочем столе, это довольно удобный вариант [за исключением описанных выше ситуаций ;)].
Так что всё-таки какое-то "прозвище" для каждого устройства должно быть.

UFO landed and left these words here

cazebo Mar 14 2016 at 21:59

Хаа, на вопросе Джея про овцу у меня откликнулась лежащая рядом с колонками Сири из планшета.

https://www.youtube.com/watch?v=uPwo-nHWQaM&feature=youtu.be&t=76

Gorodnya Mar 14 2016 at 12:48

Это ещё что. Capital One, видимо, не в курсе такой ситуации, так как теперь их клиенты могут проверять свой баланс и оплачивать счета, разговаривая с виртуальным помощником. Источник.

mark_blau Mar 14 2016 at 13:42

Предвижу художественный проект:
рядом стоят несколько «умных» предметов, и пытаются другим отдать приказание отдать приказание, в режиме свободной конкуренции.
Зрители могут принимать посильное участие.
Десятка утюгов, микроволновок и прочих погодных станций будет достаточно.

olegkrasnov Mar 14 2016 at 13:51

Ждём голосовых вирусов.

berezuev Mar 14 2016 at 14:21

Помню, как-то разговорился с таксистом (вызванным в Яндекс.Такси) о его работе, так навигатор за поездку раза 4 спрашивал маршрут, услышав свое имя…

Lerg Mar 14 2016 at 14:27

Решение на самом деле может быть очень простым — нужно во все рекламные ролики зашивать неслышимый человеком звуковой код, который бы говорил Amazon Echo, что не нужно активироваться. Другое дело, что этот код могут зачем-то использовать в злых умыслах.

LazyCrazy Mar 14 2016 at 15:37

А динамики любого телевизора/радио точно смогут воспроизвести что-то, неслышимое человеком?

Lerg Mar 14 2016 at 15:48

Не обязательно ультразвук. Можно код передать и в слышимом диапазоне, но незаметно для ушей. Один из таких примеров это как работает Shazam — приложение вычленяет код из музыки и отправляет его на сервер, чтобы получить в ответ какая это песня. Мы, конечно, слышим музыку, но понятия не имеем, что за код отправляет программа.

lorc Mar 14 2016 at 16:33

Ну вообще-то Shazam так не работает. Вы же не думаете, что например Битлы вставляли в свою музыку какой-то там код?

Lerg Mar 14 2016 at 17:34

Кодом являются вычисляемые характеристики из музыки.

lorc Mar 14 2016 at 17:39

Именно, при чем даже можно почитать какие именно:

Since Shazam needs to be noise tolerant, only the loudest notes are kept.

Т.е. шазам наоборот выбирает самые громкие ноты (что в общем довольно логично).

bobermai Mar 14 2016 at 15:38

Даже не беря в расчет неочевидность принципиальной возможности реализации неслышимого человеку сигнала на оборудовании для воспроизведения и распознавагия звука в доступном человеку диапазоне — сама концепция «реагируем на все подряд, если нет специальной команды не реагировать» кажется не слишком логичной.

Wizard_of_light Mar 14 2016 at 19:38

ИМХО, ставить приемник рядом с управляемой голосом техникой априори плохая идея. Это хуже, чем подпустить кота к клавиатуре.

stalinets Mar 14 2016 at 19:40

На правах шутки: кто-то позвонит на утреннее радио в интерактив и в прямом эфире крикнет "OK google, проститутки недорого", вечером по всей стране скандалы, на следующий день волна разводов и у всех в контекстной рекламе — проститутки… Вот это мега-троллинг! Развитие технологий показывает нам всё новые и новые чудеса.

vipCLOWN Mar 15 2016 at 11:03

Мечта, получить «Исин» с книги «Хакеры», становится все ближе.

eoffsock Mar 15 2016 at 11:05

У меня на Андроиде клавиатура с голосовым набором однажды очень резво набирала текст, слушая фильм, который я в этот момент смотрел. Почти без ошибок.