Комментарии 27
Да, пульты дистанционного управления становятся все сложнее и сложнее…
При чем здесь "умный дом" — ума не приложу. Тупой дом — это точнее. Разве телевизор от переключения каналов пультом зовется умным? А здесь в чем разница?
Просто сложный, неудобный ПДУ (пульт дистанционного управления).
На счет «умного дома». Для меня это дом, который опять же экономит мое время и выполняет какие-то действия автоматически. К примеру, уже сейчас можно настроить сценарий «автоматически включи свет в корридоре, когда я подошел к дому». Выключить свет вы сможете с помощью Алисы. Подключите автоматические гардины от Xaiomi и их можно будет настроить на открытие с восходом солнца или в определенное время, аналогично можно манипулировать ими с помощью Алисы.
У гугла для таких вещей появились «рутины», т.е. предопределенные действия, которые настраиваются прямо из приложения, простой расстановкой чекбоксов. А OpenHab также подключается через myopenHab. Сущностей значительно меньше.
Алиса до этого еще не доросла, но умнеет быстро.
Еще здорово было бы опенсорос проект с такой колонкой или группой колонок.
Я вижу такой девайс примерно так:
- небольшая дешевая колонка с массивом разнонаправленных микрофонов;
- кооперация таких однотипных колонок в mesh-сеть внутри помещения (думаю 2-3 на комнату — самый раз);
- координация между колонками по вайфай, каждая слышит звуки вокруг, режет на кусочки и широковещательными пакетами раздаёт другим колонкам, которые с помощью DSP на основе знания о своём местоположении проводят корреляции, триангуляции и фильтрации выделяя источники звуков.
- на уровне API мы получаем звуковые «чанки», промаркированные:
- идентификаторами
- временнЫми метками
- координатами внутри помещения
- а в идеальном случае ещё и распознанными лексемами
- интересная мысль на уровне API метить лексемы (по идентификатору) как атомы для распространения на все узлы с целью последующего быстрого офлайн-распознавания.
- использование ультразвуковых щелчков и триангуляции для локализации мобильных узлов распознавания относительно стационарных
Пока что, может быть, звучит довольно сложно. Но в ближайшие годы мне кажется именно за этим будущее. Среда должна пусть не «понимать», но, хотя бы, «знать» что в ней происходит, и уметь это знание в формализованной форме предоставить другим смарт-системам.
Голос, конечно, не может быть основным или единственным интерфейсом, это лишь один из аспектов.
Я хочу, чтобы «среда» «видела» также где я нахожусь, куда я смотрю, какие жесты совершаю.
Ну и для полного счастья нужно реализовать голосовой интерфейс (протокол) для создания и редактирования голосового интерфейса. Сумбурно как-то, надо, блин, статью писать.
Нужно больше сущностей!!!
запрос от серверов Яндекса поступит на сервер умения, оттуда в IFTTT, следом в myopenHAB, который передаст данные в ваш локальный инстанс
вот это адское нагромождение очень точно характеризует состояние сегодняшнего «умного дома»
и без единой строчки кодаНа фоне описанного Вами «танца с бубном» с настройками всего этого зоопарка, несколько сотен (и даже тысяч) строк кода не выглядят уж так ужасно.
Что то на айфоне она не понимает волшебные заклинания пока что
(«я уже более полугода ежедневно включаю свет в комнате голосом, и всё ещё считаю это удобным», или ещё что подобное, но обязательно с опытом в полгода и более)
Самые лучшие устройства — которые не требуют действий. Например, кондиционер включается за 15 минут до прихода и выключается через 20 минут. Или простой детектор движения который включает лампочки.
Мой ребенок учился говорить в тот момент когда siri могла везде управлять освещением, для него нормально, что свет включается голосом. Опыт использования 2 года. Сам чаще использую выключатели, любой свет можно выключить как минимум с 4-х мест в квартире.
Каково время реакции? Т.е. с момента "Алиса, включи лампочку" до собственно включения.
— взять телефон
— запустить приложение
— сказать «Алиса, включи волшебные заклинания»
— ещё ~4 секунды на подтверждение
После этого можно отдавать команды. От окончания произнесения команды до реакции — я с «ручным» секундомером намерил ~4 секунды.
Здорово, что вся эта машинерия сейчас легко и управляемо может улучшаться за счет чистых скриптов и кейсов без всяких дополнительных слоёв нейронных сетей. Скрытые формы, взвешенные состояния, условия и нечеткие автоматы. Если всё это настроить, можно прям чудесные вещи делать.
Эх, вот же она, та самая магия, о которой говорил Кларк в своём третьем законе.
Говорим Алисе «включи волшебные заклинания». Именно умение волшебные заклинания/волшебное заклинание позволит нам выполнять POST запросы к серверам IFTTT.
А GET запросы не поддерживаются? Например такого вида IP_ADRES/gpio?st=1&pin=12. Необходимо для управления устройствами на базе ESP8266 с прошивкой wifi-iot напрямую Алисой, не используя дополнительных прослоек. Из браузера срабатывает как через внутренний так и через внешний IP.
«Алиса, включи свет». Голосовое управление умным домом на базе openHAB. Без программирования и СМС