CyberexTech Nov 12 2023 at 11:01

Моя б̶е̶з̶умная колонка или бюджетный DIY голосового ассистента для умного дома

Easy

7 min

33K

Timeweb Cloud corporate blogPython*3D printersIOT

Case

+87

Comments 36

REPISOT Nov 12 2023 at 11:59

Разводка звуковой платы похожа на образец из статьи "типичные ошибки разводки печатных плат". Прямые углы, длинные линии до конденсаторов и т.п. При этом исправление этих ошибок не усложнило бы изготовление платы DIY-методом.

Dark_Purple Nov 12 2023 at 15:11

А что не так с прямыми углами? Электроны не успеют повернуть на 90 градусов?

+11

Dancho67 Nov 12 2023 at 21:39

Искажения и помехи, если кратко. Можете вскрыть любое фабричное устройство и увидите, что прямых углов на дорожках нету.

HiTechSpoon Nov 13 2023 at 10:22

На этих линия не такие высокие частоты чтобы образовавшаяся паразитные ёмкость и индуктивность повлияли на что-то, и они не слаботочные, чтобы был какой-то crosstalking. С таким же успехом можно требовать залитый полигон общего провода с обратной стороны текстолита и крыжку от наводок сверху. Это ни на что не повлияет.

DimkaI Feb 13 at 08:21

Немного дополню предыдущего оратора.
Насколько помню, как бы мы качественно не стабилизировали и не фильтровали питающее напряжение, оно всегда будет иметь пульсации. В результате чего во всех аналоговых схемах цепи питания относятся максимально далеко от входных цепей. Здесь же Vcc проходит параллельно с входной цепью левого канала. В результате получаем паразитную помеху, которую будем слышать как гул.

HiTechSpoon Feb 13 at 10:58

Да, на плате это место выглядит подозрительно и это хорошо, что вы это видите, и я бы лично дорожку не вёл параллельно линии питания, и конденсаторы поставил бы ближе к микросхеме. Но, это мои тараканы и чувство прекрасного, а по факту это здесь ни на что не повлияет.
Кстати, умозрительно помехи тут в основном будут не из-за плохой фильтрации питающего напряжения (фильтруется оно тут нормально, учитывая, что оно само по себе придёт отфильтрованным после розетки уже 2 раза), а из-за потребителя на линии питания, то есть самой PAM8403, т.к. линия питания "контактирует" со звуковой уже после конденсаторов. Как PAM8403 потребляет ток я не знаю, но судя по всему её цифровая часть работает на частоте намного выше звуковой. Не думаю, что люди её услышат, даже если бы она сильно наводилась.

Weron2 Nov 12 2023 at 14:05

А управляет умными устройствами сама колонка, или это только интерфейс взаимодействия с home assistant?

CyberexTech Nov 12 2023 at 15:50

Может и сама колонка управлять, у меня она напрямую управляет устройствами.

WondeRu Nov 12 2023 at 14:25

А как у вас распознавание голоса происходит при работающем динамике? Как-то компенсируете?

CyberexTech Nov 12 2023 at 15:51

Во время воспроизведения, она не "слушает"

Rasidel Nov 12 2023 at 15:50

Спасибо за статью. Очень интересно будет почитать про программную часть проекта. По поводу I2C интерфейса - то он на этой плате присутствует.

CyberexTech Nov 12 2023 at 15:54

Спасибо за отзыв. Возможно вы перепутали с I2C, мне был нужен I2S интерфейс для подключения цифрового микрофона.

ErshoffPeter Nov 12 2023 at 17:44

Круто!

Завидую белой завистью, как обладатель двух Алис, одной Google-станции и Сбер-стика (он тоже с голосовым интерфейсом).

CyberexTech Nov 12 2023 at 18:09

Спасибо )

SergioPoverony Dec 7 2023 at 21:47

Когда ждать продолжение с программной частью?

smart_alex Nov 12 2023 at 18:37

Ё! Если я всё правильно понял, то это как раз то, что мне (всем нам) нужно — свободный, автономный и отвязанный от всех (хитрожопых) корпораций голосовой помощник.

Дайте два!

janvarev Nov 12 2023 at 19:37

Опенсорс голосовой помощник Ирина вам в помощь: https://github.com/janvarev/Irene-Voice-Assistant (там же ссылки на 3 статьи на Хабре о нём )))

vikarti Nov 13 2023 at 14:56

Вот тоже.. и мне кажется более важно что это платформа.

Хочу себе такую штуку именно в собранном красивом работающем виде а с софтом уровня "вот ssh, софт полноценный ставьте сами, вот исходники ядра, вот документация на плату".

Вот сколько такое может стоить?

Готовая ж платформа для Ирины той же.

CyberexTech Nov 14 2023 at 23:39

Сейчас занимаюсь коробочным решением, в плане ПО для данной умной колонки, с нормальным пользовательским интерфейсом, чтобы человек далёкий от программирования смог использовать данную систему.

supersmeh Nov 12 2023 at 19:35

Класс! Буду следить. Тоже нужен такой девайс. Точнее несколько, в разных комнатах, как-то прикрутить все в один HA, хочу чтобы команда "выключи свет" работала в той комнате, где её произнес

Jury_78 Nov 12 2023 at 20:12

Интересно... Особенно на код посмотреть :)

Alex_Jet Nov 14 2023 at 04:35

В коде ничего особенно нет - определяем от какой железки пришло STT, соответственно, в ее зоне управляем оборудованием. А вот что автор использует в качестве оператора STT и TTS, особенно не используя облачные сервисы, - вот это очень интересно)

-1

Levin7 Nov 13 2023 at 08:04

Сеточка декоративная под динамик будет не лишней

CyberexTech Nov 13 2023 at 08:07

В обычном режиме эксплуатации динамик не доступен

slavius Nov 13 2023 at 12:16

Я сторонник автономных решений в плане их использования в критической инфраструктуре. А системы умного дома я отношу к этим категориям, поэтому, с моей точки зрения, использование устройств, зависящих от внешних систем, недопустимо. Описанное в статье решение не использует внешних сервисов для распознавания речи, векторизации запросов, синтеза речи и управления устройствами. И, конечно, я имею полный контроль над алгоритмами моего устройства, включая приватность.
Спасибо за каждое слово:)

CyberexTech Nov 13 2023 at 13:57

Пожалуйста). Хотя моя фраза:

И, конечно, я имею полный контроль над алгоритмами моего устройства, включая приватность.

Звучит двояко и немного зловеще )

Alex_Jet Nov 13 2023 at 18:09

@CyberexTechхорошая реализация! Поздравляю. У меня есть реализация mdmTerminal2 на Orange Pi Zero - всё работает почти замечательно. Но есть вопросы:

Что за продукт используется для голосового ассистента?
Что с нагревом процессора у этой платы?
На сколько стабилен wi-fi в этой реализации?
Не пробовали использовать массивы микрофонов со всеми фишками типа DOA, BMF и прочие?

CyberexTech Nov 13 2023 at 18:26

Спасибо за отзыв.

Что за продукт используется для голосового ассистента?

В своих проектах я использую собственные решения. Распознавание и синтез речи выполняется на устройстве, без использования внешних API. Используются внешние API только для второстепенных функций, таких как ChatGPT и курсы валют.

Что с нагревом процессора у этой платы?

С нагревом нет проблем, радиатора, что можно видеть на фото, вполне хватает. Температура SoC не поднимается выше 65 ℃, что в эксплуатационных рамках.

На сколько стабилен wi-fi в этой реализации?

Проблем с подключением к сети по Wi-Fi ни разу не наблюдал.

Не пробовали использовать массивы микрофонов со всеми фишками типа DOA, BMF и прочие?

Определение направления источника звука и бимформинг, конечно интересные штуки, но в данном устройстве я считаю их лишними, так как расположение микрофона позволяет без проблем улавливать звук со всех сторон, а нейросеть, которая отвечает за распознавание речи, справляется с шумом.

Alex_Jet Nov 13 2023 at 20:02

В своих проектах я использую собственные решения. Распознавание и синтез речи выполняется на устройстве, без использования внешних API

Ну не с нуля же писали? Наверное, это что-то типа Azure/RHvoice/Vosk/Kaldi с локальными словарями?

Определение направления источника звука и бимформинг, конечно интересные штуки, но в данном устройстве я считаю их лишними, так как расположение микрофона позволяет без проблем улавливать звук со всех сторон, а нейросеть, которая отвечает за распознавание речи, справляется с шумом.

Вот это очень интересно! Мне одного микрофона явно недостаточно. У меня кейс следующий - железка в виде "светодиодного" светильника установлена в потолок посередине помещения. Алиса и Маруся явно лучше "слышат" своими 4-6 микрофонами.

Тем более то что мой голосовой ассистент помимо того, что подключен к локальному серверу УД, еще завязан на LMS. Соответственно, музыка играет (акустика разнесена от самой железки) и ассистент должен слушать. Поэтому было бы очень круто звук с микрофона с помощью нейронной сети обрабатывать.

vvzvlad Nov 13 2023 at 18:33

Очень интересна программная часть.

alyaskatm Nov 22 2023 at 10:08

Ждем с нетерпением продолжения, железо уже куплено)

CyberexTech Nov 24 2023 at 08:19

Постараюсь в ближайшем времени. На написание статьи уходит много времени и сил, тем более, нужно понятно и кратко сформулировать свои мысли, что очень трудно. И еще, хотелось бы знать реальное число заинтересованных людей, поэтому, если не сложно, подпишитесь на мой профиль.

Rasidel Mar 23 at 20:10

Стоит ожидать продолжение?

CyberexTech Apr 4 at 10:09

Однозначно стоит!

xlop-chik Aug 7 at 23:42

есть готовый модуль ReSpeaker 2-Mics Pi HAT - wiki.seeedstudio.com/ReSpeaker_2_Mics_Pi_HAT и колхозить ничего не нужно. так же использование дорогой Orange Pi Zero 2W с 4 ГБ не обосновано - есть Picovoice и Mycroft Precise они спокойно заводятся и работают на малинке зеро, а там и проц по слабее и оперативки всего 512 метров.

-1

CyberexTech Aug 14 at 05:27

Извините, конечно, но вы какую-то ерунду написали.

Предложенные вами компоненты стоят:

ReSpeaker 2-Mics Pi HAT - 2300 руб или $25

Raspberry Pi Zero 2W - 2052 руб или $22

Только по этим двум позициям стоимость превышает в два раза, по отношению к моему решению.

на малинке зеро, а там и проц по слабее и оперативки всего 512 метров.

А это вообще странно, вы преподносите слабые характеристики как достоинство. С такими техническими характеристиками вы далеко не уедете.

Да и с чего Orange Pi Zero 2W 4 ГБ вдруг стал дорогим? Она стоит дешевле Raspberry Pi Zero 2W, при этом значительно превосходит её по техническим характеристикам.

Рекомендую всё же детальнее разбираться в вопросе перед написанием подобных комментариев.