denis-19 Jan 29 2020 at 10:21

Mail.ru открыла предзаказ на умную колонку «Капсула» с голосовым помощником «Маруся»

3 min

11K

GadgetsSocial networks and communitiesSmart HouseIT-companies

132

Comments 132

Klenov_s Jan 29 2020 at 10:42

ФСБ открыло предзаказ на новое устройство «тук-тук» ))

+17

yarkov Jan 29 2020 at 11:06

Астанавитесь! Я ещё не понял смысла Яндекс колонки, а уже и ~~тёмная сторона~~ Mail.ru выпустили своё детище.

+11

APXEOLOG Jan 29 2020 at 11:12

Смысл для компаний — глубже затянуть пользователя в экосистему своих продуктов

Смысл для пользователей — 404

-1

kvghabr Jan 29 2020 at 11:55

А как же «быть в тренде» и «быть не таким как все» одновременно?)

-2

hf35 Jan 29 2020 at 13:00

Зря вы так, крааааайне удобное устройство для кухни, где экрана нет и он не нужен, но например хочется иметь музыку.

APXEOLOG Jan 29 2020 at 13:03

Ну, у каждого свои предпочтения. Меня устраивает связка беспроводные наушники + телефон/компьютер

hf35 Jan 29 2020 at 13:18

не ну конечно у каждого могут быть свои пути. Но в общем виде — это правда удобная штука. Уж точно не 404 смысла для пользователей

extempl Jan 29 2020 at 14:38

А любой другой беспроводной колонки, на которую можно отправить всё что угодно с телефона и которая не слушает тебя круглосуточно — недостаточно?

hf35 Jan 29 2020 at 21:27

ну т.е. уже по любому уже какая то колонка на кухне нужна, и почему бы ей не быть тогда умной? На кухне зачастую очень удобно именно голосовое управление — во время мытья посуды, готовки еды когда руки заняты или грязные. И ещё это очень удобно когда на кухне не один человек. Это правда очень удобно, хотя и не выглядит так пока не попробуешь

extempl Jan 30 2020 at 07:54

В таком случае я бы предпочёл "тупую" колонку, которая начинает слушать только по жесту/нажатию на кнопку, которой можно что-то сказать. Но точно, которая не слушает меня постоянно ожидая, что я скажу что-нибудь ей.

cyberly Jan 30 2020 at 08:10

… только по жесту…

Слушать — плохо, пусть лучше смотрит? А если серьезно, по нажатию уже и так работает много всякого другого. А вот совсем без рук — это таки фича.

extempl Jan 30 2020 at 08:12

Зачем смотреть? Для этого не нужна видеокамера с отправкой видео на какие-то левые сервера чтоб нейросетью распознать жест. Всё сильно примитивнее.

cyberly Jan 30 2020 at 08:15

Да, если не ставить задачу распознать жест при примерно тех же возможных вариантах расположения относительно пользователя, при которых распознается голос.

extempl Jan 30 2020 at 08:19

Естественно. В том то и смысл локальных распознавателей, чтоб не распознавать всё подряд нужным жестом. Должен срабатывать локальный взмах руки в определённом направлении.
Я просто не понимаю зачем добавлять себе потенциальную брешь в систему. Это как приоткрыть дверь и надеяться на благоразумие прохожих, что никто не будет заходить. А потом вам не пойми откуда будет реклама яиц в ближайшем супермаркете, потому что вы невзначай вслух сказали, что они закончились.
В тему: https://habr.com/ru/news/t/486012/
Если вам кажется, что никто ничего не слушает, не сохраняет и не обрабатывает (в лучшем случае, в худшем продают), то вы сильно ошибаетесь.

cyberly Jan 30 2020 at 08:43

Если вам кажется, что никто ничего не слушает, не сохраняет и не обрабатывает (в лучшем случае, в худшем продают), то вы сильно ошибаетесь.

Не совсем так. Я, скорее, считаю, что оптимально — это считать, что вас слушают (пишут трек перемещений, снимают на видео, а ваши посты кто-то аккуратно собирает в досье) примерно всегда. А дальше — оценивать риски. Если вы делаете или говорите что-то такое, что грозит катастрофой в случае разглашения — принимайте меры (звукоизоляция, глушилки, оборудование со спецпроверкой, контроль периметра, подземный бункер на острове в тихом океане — все эти вещи давным-давно придуманы и используются ребятами, для которых это важно). Ну или не делайте таких вещей. Если же нет (исчезающе малая вероятность относительно мелких неприятностей) — вполне можно успокоиться и пустить ресурсы на что-нибудь другое.

Это как приоткрыть дверь и надеяться на благоразумие прохожих, что никто не будет заходить.

Если честно, я дверь запираю только на ночь. Потому что мне лень ходить к ней 6 раз в день, когда домашние приходят/уходят. Я знаю, что это повышает риски, но считаю, что во-первых, ненамного (а дверь все равно вскрывается, если очень нужно и я все равно бываю на улице, где никаких дверей вообще нет), а во-вторых — они все равно остаются микроскопическими.

extempl Jan 30 2020 at 09:59

Есть некоторая разница между "сохранять поисковые запросы" и "сохранять буквально всё" вне зависимости от того, есть что скрывать или нет. Потому я бы (даже если на серверах где-то там) предпочёл, чтоб оно слушало тогда, когда я хочу чтоб оно слушало. А не тогда, когда оно того хочет.

cyberly Jan 30 2020 at 10:27

Вот не соглашусь. Тут или одно или другое. Либо вы вообще не используете оборудование, которое вами не контролируется и потенциально способно к сливу данных (имеет программно управляемые микрофоны и выход в интернет), либо принимаете, что приватности нет и имеете это ввиду.

extempl Jan 30 2020 at 10:52

Почему не сделать микрофон не-программно управляемым? В смысле поставить кнопку в разрыв с реле, тогда вы будете управлять тем, когда включается запись и управлять тем, какие именно данные утекают в сеть.

cyberly Jan 30 2020 at 11:10

Ну, во-первых, пользователь не может сейчас решать, будет ли там это реле, или нет. Во-вторых, надежность такого решения не 100% — можно элементарно забыть выключить микрофон. А в-третьих, неудобно эту штуку каждый раз включать: во всех упомянутых сценариях типа «захотелось переключить трек, а руки в муке» или «надо поменять громкость, но лень вылезать из-под одеяла» уровень удобства будет как у 30-летней магнитолы и даже без пульта (что наводит на мысль «а зачем тогда вообще эта колонка»).

extempl Jan 30 2020 at 11:13

Реализованное на опенсорсной коленке распознавание фразы "э, слышь?", которая всё что делает, так это включает реле на 30+ секунд и выключает после 5 секунд тишины вполне достаточно.

пользователь не может сейчас решать

В этом и есть основная проблема. А должен мочь. Ну или самому поставить.

(Кстати, мне кажется я про такое уже читал, какой-то чехол-шептун который надевается на любую умную колонку и блокирует все звуки, кроме ключевой фразы, после которой оно шепчет колонке заветное "эй гугл" или "алекса", или кто ещё там есть.)

extempl Jan 30 2020 at 08:25

Поймите меня правильно, я не против голосового управления, но только локально в пределах квартиры. И в общем, есть опенсорсные решения (да что там решения, микрофон, динамик и открытая библиотека распознавания голоса).

cyberly Jan 30 2020 at 08:46

У вас есть опыт с ними? Просто, когда я пробовал эти решения, они работали совсем не здорово. Правда это было лет 5 назад. На самом деле я думаю, что все эти распознавания в облаке, прежде всего — потому что локально не получается сделать нормально (потому что самообучение и огромные массивы данных), а не для того, чтобы кого-то записывать.

Kanut Jan 30 2020 at 10:45

С открытыми библиотеками я вс воё время баловался и на мой взгляд слепить распознавание жестов это не такая уж невыполнимая задача. То есть на мой взгляд технически это абсолютно решаемо. Разпознавание какой-то фразы или кодового слова наверное тоже не особо сложно.
Другое дело что крупные компании просто не хотят предлагать «оффлайн-решения», а мелкие пока ещё не особо могут. Особенно учитывая что пока нет нормального стандарта для этого самого smart home.

Misaka10032 Jan 29 2020 at 15:27

А ещё можно добавить часы и управлять музыкой становиться возможным без телефона.

cyberly Jan 29 2020 at 17:46

Часы — дороговато, если покупать их только ради этого…

errik512 Jan 29 2020 at 16:42

но если хочется слушать что-то кроме Ям и вк ???

UFO just landed and posted this here

errik512 Jan 29 2020 at 17:24

ну так и я о том, что маруся так неможет ))

errik512 Jan 29 2020 at 16:43

смысл в подписке!

UFO just landed and posted this here

veselovi4 Jan 29 2020 at 11:19

Давайте уж телекран запускайте. Чего уж там ))

Baigildin Jan 29 2020 at 17:58

Чувствуется нотка инакомыслия. Пройдемте в ~~подвалы ФСБ~~ Министерство Любви, товарищ.

karl93rus Jan 29 2020 at 11:27

Больше колонок богу колонок!!! А сбер с мтсом-то для чего их делают? Ну яндекс с мейлом понятно. Там сервисы всякие. Типа такси вызвать, еды заказать, что там еще… А сбер? Кредит голосом оформить? «Греф, дай чирик до зарплаты?» А у мтс обещанный платёж попросить? Только обязательно «пожалуйста» надо будет сказать…

UFO just landed and posted this here

tmin10 Feb 13 2020 at 21:34

Есть SberFood

UFO just landed and posted this here

maxzh83 Jan 29 2020 at 13:04

платочка не хватает?

commanderxo Jan 29 2020 at 14:00

Мы рады видеть, что вы преодолели последнее испытание, в ходе которого мы притворялись, что хотим вас убить.

UFO just landed and posted this here

Yuriy_krd Jan 29 2020 at 11:59

К слову «зонд» так и хочется добавить еще одно соответствующее прилагательное :))

shadrap Jan 29 2020 at 11:49

интересно, на кой ляд они поставили 18В блок питания? Что там за мозг, неужели х-86?

veselovi4 Jan 29 2020 at 12:06

Хм… не 12 и не 24 (более менее стандартные). При поломке думаю придется обращаться к ним же. (исключая технарей конечно.Хотя у меня тоже не так много 18В блоков питания).

cyberly Jan 29 2020 at 12:19

19В — тоже вполне стандартный, для ноутбуков. Но 18… Может быть, использованная микросхема усилителя мощности не может работать при большем напряжении, и они решили использовать немного подкрученную ноутбучную зарядку?

UFO just landed and posted this here

stranger_shaman Jan 29 2020 at 14:51

Чтоб запитать два ВЧ динамика по 5 Вт и НЧ на 25Вт. Очевидно же.

cyberly Jan 29 2020 at 11:49

Хм, для общего развития… а что такое «цифровой микрофон»?

UFO just landed and posted this here

veselovi4 Jan 29 2020 at 12:23

То есть внутри корпуса микрофона я так понимаю сразу «замурован» чип ЦАПа и на выходе какая либо шина, типа i2C,SPi? Для чего такое «уточнение»? Хотя я думаю тут скорее маркетинговое колдунство. Звучно само словосочетание...«шесть ЦИФРОВЫХ микрофонов».

asakasinsky Jan 29 2020 at 13:38

Пример: INMP441
MEMS, всенаправленный, позволяет подключить себя по 24-битной шине I²S напрямую к звуковому процессору.
Аббревиатура MEMS говорит, что сенсорная часть размещена на одном кристалле с микросхемой, отвечающей за формирование выходного сигнала.
Так, что да, цифровой.

Osnovjansky Jan 29 2020 at 14:35

Зуб не дам, но где-то попадалось, что микрофоны бывают по MEMS технологии, т.е. и мембрана — сразу на кремнии.
Упс, не обновил страницу

UFO just landed and posted this here

kAIST Jan 29 2020 at 11:51

Читая комментарии, складывается ощущение что попал не на хабр, а на лор: ничего по теме не написано, "не нужно" и "опять зонд".

veselovi4 Jan 29 2020 at 12:00

Ну какова новость и изделие. Таковы и комментарии думаю.

-2

kAIST Jan 29 2020 at 12:02

А что с изделием? Новость да, очень жиденькая.
Но хабр раньше всегда славился тем, что комментарии оказывались информативнее постов.

UFO just landed and posted this here

veselovi4 Jan 29 2020 at 12:18

Хабр позиционируется «сообщество разработчиков». Ну а что за изделие? И для чего это изделие? Вот отсюда и комменты в русле «бугагашечек». Ведь публикуя новость на Хабре, тем самым она дается на обсуждение в основе своей технарям. А мы люди простые.Нет. Не злые. Но вот поёрничать на откровенно «слабые» продукты горазды.

kAIST Jan 29 2020 at 12:28

Ну а почему «слабые продукты»?
В любом случае, когда появляются конкурирующие продукты, это хорошо. Так как появляется конкуренция.

Maximuzzz Jan 30 2020 at 10:45

По описанию не выглядит «сильной», к сожалению. Заявлена поддержка вконтактовской библиотеки, но ни Spotify ни прочих стриминговых сервисов. Про спотифай понятно, сервис пока официально не доступен на территории России, но Google и Apple можно было и добавить.
Умный дом тоже оооочень ограничен. Почему не добавить поддержку Apple HomeKit, например?
Кроме идеи с rfid метками нет ничего отличающего от тонны прочих «умных» колонок.
Понимаю, что почти все реализуется через апдейт прошивки и в дальнейшем новый функционал может появиться, но пока увы.
И да, все равно хорошо, что очередной конкурент вышел на рынок. С этим согласен целиком и полностью.

kAIST Jan 30 2020 at 10:49

По мне так с rfid как раз таки не понятная идея. Голосовое управление и тут какие то метки таскать нужно, особенно с расчетом на маленьких детей, которые такие мелочи любят терять.
Единственное что вроде как новое это голосовые звонки, которых в подобных колонках действительно не хватает. Типа "найди парикмахерскую поблизости и позвони туда".

Kanut Jan 30 2020 at 10:55

Тут на мой взгляд скорее идея другая: RFID скорее нужны чтобы ребёнок не мог эти игры запускатъ в отсутствии взрослых.

extempl Jan 30 2020 at 10:58

Вот тебе красный кубик и синий. Хочешь сказку — поднеси красный кубик. Хочешь песенки — поднеси синий

Рассчёт на тех, кто ещё не способен ясно выражаться.

Zhenya_V Jan 29 2020 at 11:57

Маруся!

-1

1c80 Jan 29 2020 at 11:59

А какой смысл в таких колонках? Судя по ее виду нормального звука там просто быть не может.
Что эта, что яндекс, почему не взять нормальную жбл или маршал и наслаждаться качественным звуком?

veselovi4 Jan 29 2020 at 12:38

Ну там вроде заявлено 30Вт. И по размерам она не совсем маленькая. Просто сама суть. Иметь в доме устройство, которое 24\7 будет слушать всё вокруг используя «шесть ЦИФРОВЫХ микрофонов» и передавать куда надо и не надо. Та еще затея думаю.

-2

kAIST Jan 29 2020 at 12:54

Сколько слышу баек про то что «умные колонки» 24/7 слушают передают «куда надо». Думал на техническом ресурсе смогут объяснить, как это происходит, при условии что:
— Колонка распознает ТОЛЬКО ключевую фразу — далее она передает записанный фрагмент на сервер, где происходит дальнейшее распознование.
— Факт передачи голоса 24/7 очень легко палится обычным WiFi роутером, который считает трафик.

veselovi4 Jan 29 2020 at 13:00

То есть Вы на 300% уверены что колонка не будет передавать в момент санкционированного Вами сеанса связи с сервером накопленные(записаные) данные?

kAIST Jan 29 2020 at 13:05

Какая интересная постановка вопроса. Давайте начнем с того, каким образом эти данные будут накапливаться, если распознавание голоса идет на сервере? Не многочасовые же записи голоса передавать.

UFO just landed and posted this here

kAIST Jan 29 2020 at 13:32

Вы лично были в космосе, чтоб утверждать что земля не плоская?)
Или может быть реверсили прошивку радиомодема своего смартфона, чтоб доверять ему?
Почему вы доверяете смартфону, но не доверяете умной колонке?

Kanut Jan 29 2020 at 13:40

Вы лично были в космосе, чтоб утверждать что земля не плоская?)

Для этого всё-таки совсем не обязательно лететь в космос. есть и более простые способы :)

Или может быть реверсили прошивку радиомодема своего смартфона, чтоб доверять ему?
Почему вы доверяете смартфону, но не доверяете умной колонке?

Я пожалуй всё-таки соглашусь что на данный момент смаpтфон не является на 100% безопасным в этом плане, но он всё-таки на несколько порядков безопаснее различных «умных колонок» :)

UFO just landed and posted this here

veselovi4 Jan 29 2020 at 13:18

«Потроха» колонки Вам известны? Каков обьем флешпамяти на борту? (а она там есть). Каков механизм распознования ключевой фразы? Распознование слова «Маруся» идет средствами самой колонки или сервером? (если самой колонки, то думаю должен быть механизм обучения.Ибо разные интонации, голоса и т.п.). Если ключевую фразу будет «ловить» сервер, то это уже онлайн голоса всегда)). Наверняка будят происходить «служебные» запланированные сеансы связи с сервером (опрос колонки, апдейты там всякие и т.п.). Запись голосов в комнате по VOXу и в флешку.Потом посредством служебного сеанса связи передача на сервер. Да много чего можно придумать. И это я еще не говорю о хакинге сего изделия.Это вообще вектор атаки просто сказка. Вам мало информации по утечкам данных из банков?

UFO just landed and posted this here

delphinpro Jan 29 2020 at 13:53

Распознование слова «Маруся» идет средствами самой колонки или сервером?

Пользуюсь Я.Станцией. Ключевое слово «Алиса» она распознает даже в отсутствии интернета. Голосом любого члена семьи.

Klenov_s Jan 29 2020 at 14:03

Если распознавание идет на сервере, то как она узнает ключевую фразу?

kAIST Jan 29 2020 at 14:10

Распознование ключевой фразы идет офлайн. Там специальная нейронка, которая натренирована на распознование конкретного паттерна. Это гораздо проще, чем распозновать речь.

Klenov_s Jan 29 2020 at 14:56

1. Ну т.е не все распознавание идет на сервере.
2. Ничто не мешает иметь кольцевой буфер на несколько мегабайт и, распознав еще некоторое количество других ключевых слов, скидывать его на сервер для обработки.

kAIST Jan 29 2020 at 15:04

Ок, добавим в колонку еще десяток ключевых слов, после произнесении которых колонка отправляет дальнейшее на сервер. Какие это могут быть ключевые слова, которые интересны товарищу майору? Ну и как отправить то что сказано далее и не спалиться?

Kanut Jan 29 2020 at 15:08

Как насчёт параноидального сценария когда у колонки будет режим в котором она отправляет на сервер абсолютно всё? И возможности включения такого режима со стороны сервера? Скажем если айпишник колонки входит в список «интересных айпишников»?

kAIST Jan 29 2020 at 20:53

Если рассматривать параноидальные сценарии, то нужно тогда вообще от всей техники избавляться. Да что там от техники. Гораздо более простой и действенный сценарий, если человек заинтересовал товарища майора, это прослушка с улицы, прямо через оконное стекло.

UFO just landed and posted this here

Klenov_s Jan 29 2020 at 20:44

Абслютно любые, какие захотят, такие и загрузят в любой момент. Ну и, зная усмановцев, никто вообще не будет париться с какой-то скрытой передачей. Когда захотят, тогда и передадут, а могут еще потребовать подключить ясчик к сети, если нужно что-то передать. 99,99% пользователей этого чуда никогда не задумаются о том, что оно передает.

kAIST Jan 29 2020 at 20:51

Ну ок, 99.99% не задумается. А кто то возьмёт её специально, чтоб исследовать что она там передает, найдёт и опубликует результаты расследования.
С колонками от других производителей таких разоблачений не было, думаете потому что никто не исследовал их? А ведь достаточно массовые штуки.

Klenov_s Jan 29 2020 at 21:02

SSL и лень рулят. Да и не будет ничего, в свое время здесь была куча разоблачений АНБэшных эксплойтов для GSM и симок и что-то ничего с тех пор не изменилось. А уж, тем более, в нашем королевстве…

Maximuzzz Jan 29 2020 at 14:34

Ключевая фраза распознается локально отдельным модулем. Что Алиса, что Сири и прочие триггерятся на ключевое слово в отсутствии интернета. Это очень «дешевая» процедура с точки зрения производительности и энергоэффективности. А вот последующее распознованием производится сервером, так как требуется значительно больше мощностей.

И да, ещё классический голосовой ввод никуда не делся на мобильниках, например. Там тоже готовые ключевые фразы/слова локально отрабатываются по аналогии с триггером фразой.

UFO just landed and posted this here

Buzzzzer Jan 29 2020 at 13:03

Не обязательно же тянуть весь звук.
Можно по нажатию кнопки у товарища майора. Согласитесь, тоже мало приятного.
Да и «КЛЮЧЕВЫХ фраз» для отсылки куда надо может быть много.

kAIST Jan 29 2020 at 13:12

Если следовать этой теории заговора, то надо вообще всю технику повыбрасовать: смартфоны, компьютеры, телевизоры. В теории они ведь тоже могут передавать звук «куда нужно». Ну и шапочку из фольги заодно, ведь в теории товарищь майор с помощью специального оборудования мысли может прочитать. Кстати, надуюсь компьютер у вас стоит в клетке фарадея?

-1

UFO just landed and posted this here

Kanut Jan 29 2020 at 13:22

Ну если так рассуждать, то «закрытых и огороженных» устройств тоже не так уж и мало. И многие из них имеют «на борту» камеры и/или микрофоны и выход в интернет. Я так сейчас прикинул и у меня дома это как минимум игровая приставка, телевизор и интернет-радио.

UFO just landed and posted this here

kAIST Jan 29 2020 at 13:25

Однако часто слышу байки что, например, приложение яндекса постоянно слушает разговоры в фоне и передает куда надо чтоб подсунуть релевантную рекламу. Хотя современные смартфоны уведомляют человека, если какое то приложение использует микрофон в фоне.

UFO just landed and posted this here

veselovi4 Jan 29 2020 at 13:25

Ну смартфон я обычно сразу на lineage os перешиваю. Телевизор не смотрю (еще не хватало). Подключаю твбокс с тучей HDTV по шнурку и по HDMI на панель. Никаких смартТВ от гнусмасов и т.п. никогда и не задумывался ставить у себя дома.
Компьютер онли «дебиан». Под виндой у меня только дети в игры играют. И Вы знаете. При всей этой «параное» не теряю в качестве жизни )).

kAIST Jan 29 2020 at 13:35

В смартфоне у вас есть радиомодем, который живет отдельной жизнь, независимо от того какую прошивку вы накатите.
В PC как бы тоже хватает своих закрытых блобов, фирмварей, прошивок всего и вся.

veselovi4 Jan 29 2020 at 13:43

Это да. К сожалению не смотря на любую прошивку, вирмварь радиомодема остается закрытой (но мы не унываем и питаем надежду на скорейший выход открытой прошивки). Да и права СИМ карты остаются root-выми. Но есть разные «маневры». Как то выкорчевывание GSM модуля и использование SIP-связи с использованием ZRTP. Но это уже как говориться отдельная тема)).

smart_alex Jan 29 2020 at 17:22

Уважаемый kAIST, если вам нравится идея использования такой колонки — пользуйтесь ей на здоровье, вам никто не запрещает. Другим людям это не интересно или даже кажется безумной идеей — это их дело, оставьте им их право не пользоваться таким «сервисом».

Что касается возможных закладок в радиомодеме мобильного телефона, то об этом все знают и мирятся с этим, как с неизбежным злом (неизбежным потому, что не могут с этим ничего сделать и одновременно не могут отказаться от использования мобильного телефона).

-1

kAIST Jan 29 2020 at 19:30

Другим людям это настолько не интересно, что в каждой теме, связанной с подобными колонками десятки однотипных комментариев )
Заметьте, я не призывал пользоваться или не пользоваться, не давал оценку «нужности» и пр. Просто высказал свое мнение по поводу распространенного стереотипа.

smart_alex Jan 29 2020 at 19:49

Я думаю, что «в каждой теме, связанной с подобными колонками десятки однотипных комментариев» потому, что у людей в голове не укладывается как можно такое добровольно (и за свои деньги) поставить у себя дома. И они пытаются донести эту мысль до остальных. :)

kAIST Jan 29 2020 at 20:55

Ну так я и пытаюсь выяснить, чем же это плохо, если я добровольно этим пользуюсь.
А донести пытаются бездоказательными репликами "она слушает 24/7 и отправляет куда надо". Начинаешь говорить на эту тему, приводить аргументы, все скатывается на "ну да, она так сейчас не делает, но в теории то ещё как может".

UFO just landed and posted this here

kAIST Jan 29 2020 at 23:44

В теории, вас могут прослушать с того девайса, с которого вы сейчас читаете этот текст. Этого вам не достаточно для того чтобы от него избавиться?

UFO just landed and posted this here

kAIST Jan 29 2020 at 13:22

Активность колонки легко палится по потреблению процессора.
Если записывать голос, где его хранить то? Объемы флеш памяти под прошивку достаточно небольшие. Да и как бы хорошо не сжимал кодек, отправить «без палева» пару часов разговоров в довесок к 3-4 секундам аудио, задача не возможная. Но тут можно конечно сказать что есть какие то секретные алгоритмы ФСБ.
Про распознование офлайн — нет, не прокатит. Ресурсы очень ограничены. И даже распознование на сервере обычной разговорной речи, а не команд колонке — достаточно сложная работа. Даже в смартфонах, где ресурсов на порядок больше чем в колонке, почему то чаще распознование онлайн делают.

UFO just landed and posted this here

lgorSL Jan 29 2020 at 15:10

Есть кодеки, предназначенные для сжатия человеческого голоса. Например, в сотовой связи используются кодеки, которым хватает 5-13 кбит/с. Час записи займёт 7 мб — это мало и вполне реально передать. https://ru.m.wikipedia.org/wiki/AMR_(%D1%81%D0%B6%D0%B0%D1%82%D0%B8%D0%B5_%D0%B7%D0%B2%D1%83%D0%BA%D0%B0)

Кроме того, можно прикрутить какое-то преобразование звука в текст и передавать именно его.

kAIST Jan 29 2020 at 15:14

Ок, за день ты с колонкой не взаимодействовал, и тут она перадала пару десятком мегабайт трафика. Проверить это легко? Легко?
По поводу распознования речи, говорил уже — железо в колонках слабое и не способно на это — распознование идет на сервере.

cyberly Jan 29 2020 at 17:50

А разве существует локальное распознавание нормального качества? Когда последний раз (лет 5 назад) интересовался, все было не очень здорово и особых прорывов не намечалось.

Maximuzzz Jan 29 2020 at 14:26

Вот по последнему пункту я раз за разом поражаюсь, когда вижу очередную новость о том, что злобный Фейсбук (тут можно подставить что угодно с микрофоном) подслушал разговор и теперь показывает рекламу. При этом куча «экспертов» поддакивают, дескать да, слушают. Но почему-то никто из этих «экспертов» не провёл такого простого теста и не просканировал трафик.
Реальных случаев можно наверное по пальцам пересчитать, когда по трафику как раз и спалили, например тот случай с Яндекс навигатором.

kAIST Jan 29 2020 at 15:08

Да и то, с яндексом была немного другая история. Никто не скрывал что приложение постоянно слушало, чтоб распознать ключевую фразу. Но в какой то из версии, забыли вырубить функция для дебага, и весь звук писался в файл. Объем его был достаточно большим и уж точно бы его передача была бы видна в исходящем трафике смартфона.

1c80 Jan 29 2020 at 23:58

Ну причем тут мощность и размеры, я про качество звука. Что лить будет это понятно,
оно не будет работать без слива, надо же где то обрабатывать голос, выделять ключевые фразы и все такое.
Я просто не врубаюсь, кто возьмет отечественную умную колонку, непонятно кем и из чего сделанную, когда есть например жбл, мне кажется, это как яндекс телефон, из той же серии.

Fromych Jan 31 2020 at 16:05

ям брал отечественную, а если точнее, то яндекс. доволен, как слонопотам, т.к и функции колонки, и станции. а за счёт телефона сказать не могу, но знакомый говорит, что не так уж он и плох, а местами даже хорош, особенно за 8к.

stranger_shaman Jan 31 2020 at 10:58

Завялено 30Вт, но блок питания на 18Вт.

-1

cyberly Jan 31 2020 at 11:02

Блок питания 18 вольт 2 ампера. 36 ватт у меня получилось.

stranger_shaman Jan 31 2020 at 13:20

И даже этого не хватит, если 30Вт это номинальная мощность, а не китайская пиковая. Реально номинал будет в районе 1/3 от заявленной. Где-то в районе 5-9Вт для НЧ. В общем-то что-либо большее в такой бюджет и не запихнешь.

-1

shrapneel Jan 29 2020 at 13:20

Голос у нее был неприятный в прошлой новости

sborisov Jan 29 2020 at 13:34

del. Это разные ходинги. Приношу свои извинения.

kAIST Jan 29 2020 at 13:36

А Rambler тут причем?

UFO just landed and posted this here

peacemakerv Jan 29 2020 at 15:25

Странно, что не начали встраивать всю это «звуковую заумь» в TV.

kanvas Jan 29 2020 at 15:42

На главной странице «Капсулы» не сообщается, что голосовые данные сохраняются на сервере, в полном объеме пока включена колонка, не сообщается, что данные могут использоваться для передачи третьим лицам, для анализа жизни пользователя и анализа как на пользователе заработать, не является ли такая политика основанием для штрафов различным «госнадзорами» производителя?

-1

Crazyvlad Jan 29 2020 at 20:20

Лицензионное соглашение можно обновить перед выпуском изделия. Да и в процессе эксплуатации.

errik512 Jan 29 2020 at 15:56

смысл wifi колонки без Airplay или Chromecast ??? чтоб слушать по блютузу?? дичь.
специально так сделали чтоб на другие сервисы не слазили с подписки ВК ((((
за теже деньи лучше взять JBL PLAYLIST

-1

kAIST Jan 29 2020 at 19:26

Смысл подобных колонок это автономная работа с голосовым управлением. И сфера применения дома не ограничивается музыкой.
Например, JBL playlist может ставить таймер на кухне, ставить музыку по запросу, читать новости, играть в игры, играть радио и пр. И все это «без рук».

errik512 Jan 30 2020 at 12:39

смысл колонок это играть любую музыку!!!
а вот эта маруся может только из вк.
а гугласистент есть в любом телефоне.

errik512 Jan 30 2020 at 12:47

и голосовое управление не всегда удобно и нужно. начью например.

borisxm Jan 30 2020 at 08:15

Смысл подобных колонок это автономная работа с голосовым управлением.

Вот когда они будут действительно автономными, с локальным распознаванием, тогда от них и будет польза. А пока, это просто шесть удаленных от серверов mail.ru _цифровых_ микрофонов.

kAIST Jan 30 2020 at 10:52

А смысл от их полной автономности? Музыку из стриминговых сервисов тянут, всякие вещи типа погоды и пр, из интернета.

extempl Jan 30 2020 at 10:59

Смысл в том, чтоб в интернет улетали только поисковые запросы, а не всё, что вы произносите. Об ограничении получения данных никто не говорит. Только о локальном распознавании запросов.

borisxm Jan 30 2020 at 11:13

А смысл от их полной автономности?

Зачем эти приписки? Речь шла о «локальном распознавании». К тому же, мне, например, требуется от такой колонки только возможность выполнения MQTT запросов по фразам и озвучивание ответов. За такой функционал готов заплатить и рекомендовать его другим. Хоть сколько нибудь полезного применения нынешних алис и марусь я не вижу, поскольку неконтролируемый обмен сводит даже предполагаемую потенциальную пользу на нет.