Comments 132
Смысл для компаний — глубже затянуть пользователя в экосистему своих продуктов
Смысл для пользователей — 404
Ну, у каждого свои предпочтения. Меня устраивает связка беспроводные наушники + телефон/компьютер
А любой другой беспроводной колонки, на которую можно отправить всё что угодно с телефона и которая не слушает тебя круглосуточно — недостаточно?
В таком случае я бы предпочёл "тупую" колонку, которая начинает слушать только по жесту/нажатию на кнопку, которой можно что-то сказать. Но точно, которая не слушает меня постоянно ожидая, что я скажу что-нибудь ей.
… только по жесту…Слушать — плохо, пусть лучше смотрит? А если серьезно, по нажатию уже и так работает много всякого другого. А вот совсем без рук — это таки фича.
Зачем смотреть? Для этого не нужна видеокамера с отправкой видео на какие-то левые сервера чтоб нейросетью распознать жест. Всё сильно примитивнее.
Естественно. В том то и смысл локальных распознавателей, чтоб не распознавать всё подряд нужным жестом. Должен срабатывать локальный взмах руки в определённом направлении.
Я просто не понимаю зачем добавлять себе потенциальную брешь в систему. Это как приоткрыть дверь и надеяться на благоразумие прохожих, что никто не будет заходить. А потом вам не пойми откуда будет реклама яиц в ближайшем супермаркете, потому что вы невзначай вслух сказали, что они закончились.
В тему: https://habr.com/ru/news/t/486012/
Если вам кажется, что никто ничего не слушает, не сохраняет и не обрабатывает (в лучшем случае, в худшем продают), то вы сильно ошибаетесь.
Если вам кажется, что никто ничего не слушает, не сохраняет и не обрабатывает (в лучшем случае, в худшем продают), то вы сильно ошибаетесь.
Не совсем так. Я, скорее, считаю, что оптимально — это считать, что вас слушают (пишут трек перемещений, снимают на видео, а ваши посты кто-то аккуратно собирает в досье) примерно всегда. А дальше — оценивать риски. Если вы делаете или говорите что-то такое, что грозит катастрофой в случае разглашения — принимайте меры (звукоизоляция, глушилки, оборудование со спецпроверкой, контроль периметра, подземный бункер на острове в тихом океане — все эти вещи давным-давно придуманы и используются ребятами, для которых это важно). Ну или не делайте таких вещей. Если же нет (исчезающе малая вероятность относительно мелких неприятностей) — вполне можно успокоиться и пустить ресурсы на что-нибудь другое.
Это как приоткрыть дверь и надеяться на благоразумие прохожих, что никто не будет заходить.Если честно, я дверь запираю только на ночь. Потому что мне лень ходить к ней 6 раз в день, когда домашние приходят/уходят. Я знаю, что это повышает риски, но считаю, что во-первых, ненамного (а дверь все равно вскрывается, если очень нужно и я все равно бываю на улице, где никаких дверей вообще нет), а во-вторых — они все равно остаются микроскопическими.
Есть некоторая разница между "сохранять поисковые запросы" и "сохранять буквально всё" вне зависимости от того, есть что скрывать или нет. Потому я бы (даже если на серверах где-то там) предпочёл, чтоб оно слушало тогда, когда я хочу чтоб оно слушало. А не тогда, когда оно того хочет.
Почему не сделать микрофон не-программно управляемым? В смысле поставить кнопку в разрыв с реле, тогда вы будете управлять тем, когда включается запись и управлять тем, какие именно данные утекают в сеть.
Реализованное на опенсорсной коленке распознавание фразы "э, слышь?", которая всё что делает, так это включает реле на 30+ секунд и выключает после 5 секунд тишины вполне достаточно.
пользователь не может сейчас решать
В этом и есть основная проблема. А должен мочь. Ну или самому поставить.
(Кстати, мне кажется я про такое уже читал, какой-то чехол-шептун который надевается на любую умную колонку и блокирует все звуки, кроме ключевой фразы, после которой оно шепчет колонке заветное "эй гугл" или "алекса", или кто ещё там есть.)
Поймите меня правильно, я не против голосового управления, но только локально в пределах квартиры. И в общем, есть опенсорсные решения (да что там решения, микрофон, динамик и открытая библиотека распознавания голоса).
Другое дело что крупные компании просто не хотят предлагать «оффлайн-решения», а мелкие пока ещё не особо могут. Особенно учитывая что пока нет нормального стандарта для этого самого smart home.
но если хочется слушать что-то кроме Ям и вк ???
смысл в подписке!
MEMS, всенаправленный, позволяет подключить себя по 24-битной шине I²S напрямую к звуковому процессору.
Аббревиатура MEMS говорит, что сенсорная часть размещена на одном кристалле с микросхемой, отвечающей за формирование выходного сигнала.
Так, что да, цифровой.
Упс, не обновил страницу
Читая комментарии, складывается ощущение что попал не на хабр, а на лор: ничего по теме не написано, "не нужно" и "опять зонд".
А что с изделием? Новость да, очень жиденькая.
Но хабр раньше всегда славился тем, что комментарии оказывались информативнее постов.
В любом случае, когда появляются конкурирующие продукты, это хорошо. Так как появляется конкуренция.
По описанию не выглядит «сильной», к сожалению. Заявлена поддержка вконтактовской библиотеки, но ни Spotify ни прочих стриминговых сервисов. Про спотифай понятно, сервис пока официально не доступен на территории России, но Google и Apple можно было и добавить.
Умный дом тоже оооочень ограничен. Почему не добавить поддержку Apple HomeKit, например?
Кроме идеи с rfid метками нет ничего отличающего от тонны прочих «умных» колонок.
Понимаю, что почти все реализуется через апдейт прошивки и в дальнейшем новый функционал может появиться, но пока увы.
И да, все равно хорошо, что очередной конкурент вышел на рынок. С этим согласен целиком и полностью.
По мне так с rfid как раз таки не понятная идея. Голосовое управление и тут какие то метки таскать нужно, особенно с расчетом на маленьких детей, которые такие мелочи любят терять.
Единственное что вроде как новое это голосовые звонки, которых в подобных колонках действительно не хватает. Типа "найди парикмахерскую поблизости и позвони туда".
Маруся!
Что эта, что яндекс, почему не взять нормальную жбл или маршал и наслаждаться качественным звуком?
— Колонка распознает ТОЛЬКО ключевую фразу — далее она передает записанный фрагмент на сервер, где происходит дальнейшее распознование.
— Факт передачи голоса 24/7 очень легко палится обычным WiFi роутером, который считает трафик.
Или может быть реверсили прошивку радиомодема своего смартфона, чтоб доверять ему?
Почему вы доверяете смартфону, но не доверяете умной колонке?
Вы лично были в космосе, чтоб утверждать что земля не плоская?)
Для этого всё-таки совсем не обязательно лететь в космос. есть и более простые способы :)
Или может быть реверсили прошивку радиомодема своего смартфона, чтоб доверять ему?
Почему вы доверяете смартфону, но не доверяете умной колонке?
Я пожалуй всё-таки соглашусь что на данный момент смаpтфон не является на 100% безопасным в этом плане, но он всё-таки на несколько порядков безопаснее различных «умных колонок» :)
2. Ничто не мешает иметь кольцевой буфер на несколько мегабайт и, распознав еще некоторое количество других ключевых слов, скидывать его на сервер для обработки.
Ну ок, 99.99% не задумается. А кто то возьмёт её специально, чтоб исследовать что она там передает, найдёт и опубликует результаты расследования.
С колонками от других производителей таких разоблачений не было, думаете потому что никто не исследовал их? А ведь достаточно массовые штуки.
Ключевая фраза распознается локально отдельным модулем. Что Алиса, что Сири и прочие триггерятся на ключевое слово в отсутствии интернета. Это очень «дешевая» процедура с точки зрения производительности и энергоэффективности. А вот последующее распознованием производится сервером, так как требуется значительно больше мощностей.
И да, ещё классический голосовой ввод никуда не делся на мобильниках, например. Там тоже готовые ключевые фразы/слова локально отрабатываются по аналогии с триггером фразой.
Можно по нажатию кнопки у товарища майора. Согласитесь, тоже мало приятного.
Да и «КЛЮЧЕВЫХ фраз» для отсылки куда надо может быть много.
Компьютер онли «дебиан». Под виндой у меня только дети в игры играют. И Вы знаете. При всей этой «параное» не теряю в качестве жизни )).
В PC как бы тоже хватает своих закрытых блобов, фирмварей, прошивок всего и вся.
Что касается возможных закладок в радиомодеме мобильного телефона, то об этом все знают и мирятся с этим, как с неизбежным злом (неизбежным потому, что не могут с этим ничего сделать и одновременно не могут отказаться от использования мобильного телефона).
Заметьте, я не призывал пользоваться или не пользоваться, не давал оценку «нужности» и пр. Просто высказал свое мнение по поводу распространенного стереотипа.
Ну так я и пытаюсь выяснить, чем же это плохо, если я добровольно этим пользуюсь.
А донести пытаются бездоказательными репликами "она слушает 24/7 и отправляет куда надо". Начинаешь говорить на эту тему, приводить аргументы, все скатывается на "ну да, она так сейчас не делает, но в теории то ещё как может".
Если записывать голос, где его хранить то? Объемы флеш памяти под прошивку достаточно небольшие. Да и как бы хорошо не сжимал кодек, отправить «без палева» пару часов разговоров в довесок к 3-4 секундам аудио, задача не возможная. Но тут можно конечно сказать что есть какие то секретные алгоритмы ФСБ.
Про распознование офлайн — нет, не прокатит. Ресурсы очень ограничены. И даже распознование на сервере обычной разговорной речи, а не команд колонке — достаточно сложная работа. Даже в смартфонах, где ресурсов на порядок больше чем в колонке, почему то чаще распознование онлайн делают.
Есть кодеки, предназначенные для сжатия человеческого голоса. Например, в сотовой связи используются кодеки, которым хватает 5-13 кбит/с. Час записи займёт 7 мб — это мало и вполне реально передать. https://ru.m.wikipedia.org/wiki/AMR_(%D1%81%D0%B6%D0%B0%D1%82%D0%B8%D0%B5_%D0%B7%D0%B2%D1%83%D0%BA%D0%B0)
Кроме того, можно прикрутить какое-то преобразование звука в текст и передавать именно его.
По поводу распознования речи, говорил уже — железо в колонках слабое и не способно на это — распознование идет на сервере.
Вот по последнему пункту я раз за разом поражаюсь, когда вижу очередную новость о том, что злобный Фейсбук (тут можно подставить что угодно с микрофоном) подслушал разговор и теперь показывает рекламу. При этом куча «экспертов» поддакивают, дескать да, слушают. Но почему-то никто из этих «экспертов» не провёл такого простого теста и не просканировал трафик.
Реальных случаев можно наверное по пальцам пересчитать, когда по трафику как раз и спалили, например тот случай с Яндекс навигатором.
оно не будет работать без слива, надо же где то обрабатывать голос, выделять ключевые фразы и все такое.
Я просто не врубаюсь, кто возьмет отечественную умную колонку, непонятно кем и из чего сделанную, когда есть например жбл, мне кажется, это как яндекс телефон, из той же серии.
смысл wifi колонки без Airplay или Chromecast ??? чтоб слушать по блютузу?? дичь.
специально так сделали чтоб на другие сервисы не слазили с подписки ВК ((((
за теже деньи лучше взять JBL PLAYLIST
Смысл подобных колонок это автономная работа с голосовым управлением.Вот когда они будут действительно автономными, с локальным распознаванием, тогда от них и будет польза. А пока, это просто шесть удаленных от серверов mail.ru _цифровых_ микрофонов.
А смысл от их полной автономности? Музыку из стриминговых сервисов тянут, всякие вещи типа погоды и пр, из интернета.
Смысл в том, чтоб в интернет улетали только поисковые запросы, а не всё, что вы произносите. Об ограничении получения данных никто не говорит. Только о локальном распознавании запросов.
А смысл от их полной автономности?Зачем эти приписки? Речь шла о «локальном распознавании». К тому же, мне, например, требуется от такой колонки только возможность выполнения MQTT запросов по фразам и озвучивание ответов. За такой функционал готов заплатить и рекомендовать его другим. Хоть сколько нибудь полезного применения нынешних алис и марусь я не вижу, поскольку неконтролируемый обмен сводит даже предполагаемую потенциальную пользу на нет.
Mail.ru открыла предзаказ на умную колонку «Капсула» с голосовым помощником «Маруся»