Как стать автором
Обновить

«Алиса, включи свет». Голосовое управление умным домом на базе openHAB. Без программирования и СМС

Время на прочтение9 мин
Количество просмотров102K
Всего голосов 27: ↑27 и ↓0+27
Комментарии27

Комментарии 27

Да, пульты дистанционного управления становятся все сложнее и сложнее…
При чем здесь "умный дом" — ума не приложу. Тупой дом — это точнее. Разве телевизор от переключения каналов пультом зовется умным? А здесь в чем разница?
Просто сложный, неудобный ПДУ (пульт дистанционного управления).

Если опираться исключительно на статью, то действительно, простой пульт с кнопкой заменили на сложный пульт с кнопками и голосом. Для меня интерфейс является хорошим, если он экономит мое время. В текущем варианте, с Алисой в телефоне, интерфейс плохой, звук я выключу быстрее пультом от ТВ. Но теперь представьте, что Яндекс выпустил свою колонку с Алисой. Она слушает вас все время, вам в принципе не надо искать никакие пульты, вы просто говорите фразу и происходит событие, такой вариант будет удобнее и быстрее поиска нужного пульта.
На счет «умного дома». Для меня это дом, который опять же экономит мое время и выполняет какие-то действия автоматически. К примеру, уже сейчас можно настроить сценарий «автоматически включи свет в корридоре, когда я подошел к дому». Выключить свет вы сможете с помощью Алисы. Подключите автоматические гардины от Xaiomi и их можно будет настроить на открытие с восходом солнца или в определенное время, аналогично можно манипулировать ими с помощью Алисы.
У меня колонка Google Mini, пока естественно на английском, но довольно удобно когда мелкий ребенок на руках или просто чем-то руки заняты сказать, например: Hey google, I'm leaving. И колонка выключает свет в квартире.
У гугла для таких вещей появились «рутины», т.е. предопределенные действия, которые настраиваются прямо из приложения, простой расстановкой чекбоксов. А OpenHab также подключается через myopenHab. Сущностей значительно меньше.
Алиса до этого еще не доросла, но умнеет быстро.
Колонка от яндекса — это было бы очень здорово. Скорее бы.
Еще здорово было бы опенсорос проект с такой колонкой или группой колонок.
Я вижу такой девайс примерно так:
  • небольшая дешевая колонка с массивом разнонаправленных микрофонов;
  • кооперация таких однотипных колонок в mesh-сеть внутри помещения (думаю 2-3 на комнату — самый раз);
  • координация между колонками по вайфай, каждая слышит звуки вокруг, режет на кусочки и широковещательными пакетами раздаёт другим колонкам, которые с помощью DSP на основе знания о своём местоположении проводят корреляции, триангуляции и фильтрации выделяя источники звуков.
  • на уровне API мы получаем звуковые «чанки», промаркированные:
    • идентификаторами
    • временнЫми метками
    • координатами внутри помещения
    • а в идеальном случае ещё и распознанными лексемами

  • интересная мысль на уровне API метить лексемы (по идентификатору) как атомы для распространения на все узлы с целью последующего быстрого офлайн-распознавания.
  • использование ультразвуковых щелчков и триангуляции для локализации мобильных узлов распознавания относительно стационарных

Пока что, может быть, звучит довольно сложно. Но в ближайшие годы мне кажется именно за этим будущее. Среда должна пусть не «понимать», но, хотя бы, «знать» что в ней происходит, и уметь это знание в формализованной форме предоставить другим смарт-системам.
Голос, конечно, не может быть основным или единственным интерфейсом, это лишь один из аспектов.
Я хочу, чтобы «среда» «видела» также где я нахожусь, куда я смотрю, какие жесты совершаю.

Ну и для полного счастья нужно реализовать голосовой интерфейс (протокол) для создания и редактирования голосового интерфейса. Сумбурно как-то, надо, блин, статью писать.
НЛО прилетело и опубликовало эту надпись здесь
Перефразируя одно высказывание:
Ты хочешь Алису чтобы управлять своими электроприборами в доме?! Будь проклят ты, если тебе понадобится такая возможность.
Будем надеяться, что в недалеком будущем все изменится, и смартфон + ifttt будут не нужны.
НЛО прилетело и опубликовало эту надпись здесь
Может Яндекс додумается создать аналог www.blynk.cc с Алисой, тогда прикручивать голосовое управление к поделкам будет в разы проще?

в таскере есть плагин для обработки голосовых команд, и на определенные комманды публиковать или озвучивать данные с mqtt. в итоге все можно реализовать локально, без облака, и так же управлять освещением или ещё чем либо

запрос от серверов Яндекса поступит на сервер умения, оттуда в IFTTT, следом в myopenHAB, который передаст данные в ваш локальный инстанс

вот это адское нагромождение очень точно характеризует состояние сегодняшнего «умного дома»

Вы абсолютно правы. За 10 лет только вайфай в розетках появился, а толку ноль. Ничего не стало юзерфрендли.
и без единой строчки кода
На фоне описанного Вами «танца с бубном» с настройками всего этого зоопарка, несколько сотен (и даже тысяч) строк кода не выглядят уж так ужасно.

Что то на айфоне она не понимает волшебные заклинания пока что

мажордомо такие штуки давно делает не?
ага, тут именно идея была использовать openHAB
А может ли кто-нибудь рассказать об опыте использования голосового управления чем-то в доме на протяжении более чем полугода?
(«я уже более полугода ежедневно включаю свет в комнате голосом, и всё ещё считаю это удобным», или ещё что подобное, но обязательно с опытом в полгода и более)
Могу высказать опыт пары дней на примере с Сири? Очень много недостатков (приходится говорить, Сири может не понять и придется повторить, нужно говорить недалеко от устройства или утыкать весь дом микрофонами). Отказался даже не начав толком.
Самые лучшие устройства — которые не требуют действий. Например, кондиционер включается за 15 минут до прихода и выключается через 20 минут. Или простой детектор движения который включает лампочки.

Мой ребенок учился говорить в тот момент когда siri могла везде управлять освещением, для него нормально, что свет включается голосом. Опыт использования 2 года. Сам чаще использую выключатели, любой свет можно выключить как минимум с 4-х мест в квартире.

Каково время реакции? Т.е. с момента "Алиса, включи лампочку" до собственно включения.

Судя по видео, вначале идёт подготовительная работа:
— взять телефон
— запустить приложение
— сказать «Алиса, включи волшебные заклинания»
— ещё ~4 секунды на подтверждение

После этого можно отдавать команды. От окончания произнесения команды до реакции — я с «ручным» секундомером намерил ~4 секунды.
Хочется какой-то голосовой интерфейс для конструктора и редактора скиллов. Тогда некорректное поведение можно было бы поправить на ходу.
Здорово, что вся эта машинерия сейчас легко и управляемо может улучшаться за счет чистых скриптов и кейсов без всяких дополнительных слоёв нейронных сетей. Скрытые формы, взвешенные состояния, условия и нечеткие автоматы. Если всё это настроить, можно прям чудесные вещи делать.
Эх, вот же она, та самая магия, о которой говорил Кларк в своём третьем законе.
Говорим Алисе «включи волшебные заклинания». Именно умение волшебные заклинания/волшебное заклинание позволит нам выполнять POST запросы к серверам IFTTT.

А GET запросы не поддерживаются? Например такого вида IP_ADRES/gpio?st=1&pin=12. Необходимо для управления устройствами на базе ESP8266 с прошивкой wifi-iot напрямую Алисой, не используя дополнительных прослоек. Из браузера срабатывает как через внутренний так и через внешний IP.
Ребят, я понимаю, что вы программисты, инженеры, ява сценаристы и так далее… Но обычному пользователю, чтоб подключить обычный девайс к обычному «умному» дому нужно потерять как минимум месяц жизни. Конечно, у всех закрытые системы. Сложно связать несвязуемое. Но например обычные выключатели света sonoff чтоб подключить к алисе нужно 2-3 устройства, 3-4 сервиса и тонны непонятной хурмы прочитать. У меня есть VERA Plus controller, но чтоб хоть что-то подключить нужно нереальная куча сервисов, кодов, знаний и т.д. Можно сделать на базе алисы простой контроллер, чтоб он сам прошивал девайсы, ставил нужный код в строчки и подключал сервисы, а не вот эти танцы с бубнами?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации