
Комментарии 13
Когда наконец то будет нормальный ИИ который не требует подключения куда то где товарищ майор или американский его аналог будет записывать мой каждый пук :) А чтобы все работало автономно от интернета и даже в апокалипсис - а то какая корявая и дурная фигня выходит реально . Сервер упадет и даже Гг не смоешь в умном унитазе - поскольку микрофон там будет а вот ручки-кнопки уже нет ... Кому вообще пришла такая идея впервые ?
В контексте поста, распознавание речи в структурированные команды работало еще до Siri, еще на кнопочных телефонах Sony-Ericsson. И сегодня распознавать речь очень доступно на домашнем, вполне бюджетном железе...
А почему бы в качестве устройства ввода не использовать смартфон? Он у всех под рукой. У него хороший микрофон. Память, процессор. Динамики, он заодно может разговор поддержать. А esp только в качестве актуаторов оборудования.
Такая система тоже кажется хорошим вариантом. С телефона можно напрямую передавать голос ИИ, а ответ передавать уже на ESP. Только в таком случае система по голосу будет работать только при наличии в доме рабочего телефона (хотя сложно представить ситуацию когда бы это было не так). Но что делать в случаях если телефон разрядился; или если в доме пару жильцов, чей телефон использовать; или сейчас телефон использоваться для более важных задач и открытие там окна для общения с ИИ будет мешать. Можно взять старый телефон на котором запустить всю эту систему, только не костыльно ли выходит? На ESP32 написал код - и только этот код выполняется. На телефоне(в этом контексте именно про неиспользуемый) же много других задач(обновления, перезагрузки, другие проблемы которые могут помешать работе системы) и автоматизировать их решения будет не лёгкой задачей. Хотя в принципе, в большинстве случаев использование и основного телефона будет адекватным, но нужно продумать как решить кейсы когда передача в LLM и обратно может быть затруднена/нарушена.
Я уж думал тут будет про AI блок ESP32 S3, а тут....
Мне в голову приходил похожий вариант, но ESP отправляет голос на min-PС в локалке, на котором речь распознается локально оффлайн. Так и задержка будет минимальная и независимость.
«Если тема интересна, могу в следующей статье написать мануал как собрать ночник с голосовым управлением»
Да, интересно, только без телеги
А сейчас ? Магия ))) мой ночник из магазина , в котором по умолчанию esp в каком-то своём исполнении, управляется голосом с телефона. Но через интернет снова же , через китайский сервак . Задержка пол секунды примерно. Мало того, мобила передаёт в центр Гугл ассистента, там распознают только мой голос, посылает чёто там китайцам , они мне в ночник, да и ещё в 10 устройств других.
Так в чём у них проблема ? Завоевать рынок какой-то коробкой , которая прям дома голос будет понимать , ну 200 команд и сочетаний и возвращать команды сразу в сети на приборы.
Ммм... Я так понимаю, это чисто умозрительный концепт на основе идей от ИИ? Использование флешки заместо RAM... Ну теоретически можно, если взять столько, что даже десяток болтливых детей не смогут убить ее всю.
Но приличный разработчик воткнул бы PSRAM какой-нибудь. 8 МБ хватит на всех
AI based IoT на esp32 для элементов Headless неумного дома