Как стать автором
Обновить

Комментарии 22

Ну вот, про облака расписали, а проблемы бывшего самого большого облака в россии по управлению котлами отопления - OwenCloud и не расписали. ( а котлы отопления это очень даже про умные дома)

И даже не расписали как они стали за него брать денег и все сопутствующие этому проблемы пользователей. ай-я-я-й.

Спасибо за наводку, исследую данную тему

А они не единственные. По размеру сопоставимых ещё около 3-х компаний с аналогичными заходами а "облачные сервисы". Жалко что вы не погрузились в тему глубоко. Тема весьма интересная для анализа.

первое правило облачного умного дома: не используйте облачный умный дом!

второе правило облачного умного дома: используйте хотя бы свой личный сервер!

третье правило облачного умного дома: запомните, это - не ваш дом, это - дом духа облака :)

Проблема локального умного дома в облачном голосовом помощнике. Ибо локальные голосовые помощники, если есть, то либо с русским плохо дружат, то вообще, "speaker dependant". Для оснащения условной "Алисой" достаточно набросать в каждой комнате/санузле колонку за 3500-4000р. (или "списанный смартфон"), со всеми распространенными умными домами дружат из коробки. Для популярного local voice assistant надо либо в каждую комнату ставить что-то типа малинки, либо централизованно прокладывать микрофоны на этапе ремонта.

К локальному умному дому легко прикручивается облако с той же Алисой для голосового управления. Суть в том, что без интернета/облака теряется только голосовое управление и сбор статистики, а все остальное будет работать. То есть полностью отказываться от облака не нужно, оно должно быть как дополнение, а не основа умного дома

И как это противоречит моему посту?

НЛО прилетело и опубликовало эту надпись здесь

Как раз много времени провожу изучая и настраивая голосовое управление УД.
Связка Rhasspy + Silero TTS + Home Assistant работает вполне на уровне. Распознавание речи примерно 85-100%.
В качестве сателлитов использую разные варианты, в основном на ESP32 (никаких малин и прочего). Стоимость одного комплекта на али - 20USD + корпус.
Обучение простое, понятное и интуитивное. Добавив одну автоматизацию в Home Assistant и один универсальный код в Sentences Rhasspy получаем полное управление светом в Home Assistant голосовыми командами.

И да! Только локальный сервис.
Любое облако - зло. Все, что лежит в облаке - принадлежит тому, кому принадлежит это облако. А вам просто дали возможность доложить туда еще что-то.

Я не сторонник делить на черное/белое, облако можно использовать для опциональных штук типа голосового управления. Но вы правы, что данные в облаке принадлежат его провайдеру. Так что если совсем уж заморачиваться с безопасностью, то лучше ничего не отдавать, а использовать локальное решение

Вот как раз для меня было важно уйти от всех "облачных" сервисов. Не говоря уже о локальных погодных станций с датчиками PM и прочим. И как раз голосовое управление сейчас уже очень важно. Год 2023, как пишет комьюнити Rshappy - год перехода на голосовое управление. На локальное голосовое управление.

В качестве сателлитов использую разные варианты, в основном на ESP32
(никаких малин и прочего). Стоимость одного комплекта на али - 20USD +
корпус.

Можете рассказать подробнее? Какие микрофоны используете, как отправляете данные на сервер с софтом и т.п. Очень интересно, но пока со стороны это выглядит, как штука, на которую надо потратить кучу времени, надеюсь я не прав.

Микрофоны встроены на плате. Я использую 4 варианта плат. ESP32 LyraT, AudioKit от AI и M5 Atom Echo. Четвертый вариант - DIY который ожидает доставки из Китая плат для сборки.
Вы не правы - это не шутка. Именно так все и происходит.

Спасибо за ответ, не знал о таких девайсах. Я говорил не про «шутку», а про «штуку», но это не важно :)

Простите, что-то я не так прочитал. Да, девайсы есть и они работают. После первичного опыта с разбором что и как - продолжение дается очень просто. Но это уже решение не для уровня малинок и прочих апельсинок.
Для сравнение тренировка 10 правил rhasspy на ROCK Pi 3A длится примерно 1 минуту. В то же время на Intel Atom x5-E3940 -18 секунд.

Я верно понимаю что "сателлитами" называете ESP, с микрофонами, который цифруют-передают на сервер распознавания звук?
А укажите путь по которому искать, предполагаю на гитчабе есть описание решения?

Ищите по названию ESP32 LytaT. Только рассматривайте версию 4.3.

Ну а начинать лучше с готового решения - M5 Atom Echo

> Я верно понимаю что "сателлитами" называете ESP, с микрофонами, который цифруют-передают на сервер распознавания звук?
Более того, они еще и ответ проигрывают. То есть в топик MQTT Hermes отправляем в ответ на запрос текст, который потом проигрывается в виде аудио файла на сателлите.

Понятно, благодарю. Давно делал что-то похожее, stm32+ethernet - интересно, пощупаю.

А как у M5 Atom Echo с громкостью ответов? На сайте жалуются, что в нескольких метрах уже ничего не слышно.

Очень плохо. Его можно использовать только для настройки. Там внутри - пищалка.

Распознавание речи примерно 85-100%.

у меня вопросы по вашей связке:

  1. как насчёт фонового шума? если музыка орёт, радио, или вообще - новости по телеку голосом?

  2. зависит ли распознавание от персоны (speaker dependant)?

  3. насколько русский движок хорош по сравнению с английским?

  4. насколько хватает одной esp-ки на большую комнату?

  5. как часто esp-шки зависаю, глючат, приходится перезагружать.

    У меня самого в одном доме полностью локальный умный дом DIY на ESP и малине (blynk), а второй построил на промышленном облачном ewelink/sonoff с алисой с перспективой перевода на локальный режим и home assistant. Пока не решил, что лучше. И там и там свои + & -

  1. Фоновый шум мешает. Если орет музыка, то вероятность распознавания снижается. Новости - голосом по ТВ - не пробовал. Будет оказия - проверю.

  2. Нет. Но зависит WakeWord, если используете записываемый.

  3. Работает вообще без нареканий.

  4. У меня открытый второй уровень на лестнице. С первого этажа - слышит. Там возможно усиление микрофона до 24db

  5. Если после рестарта (при необходимости) не зависла на первом вызове (пока не получается отловить причину), то работает долго.

Я тоже имел ESP+Tasmota+Zigbee+Малинку_с_SSD. Потом, когда начал заниматься более углублено и, в особенности, когда решил, что голос должен быть локальным - малинки и прочего стало не хватать. И памяти. Памяти надо как можно больше для голоса.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий