Как стать автором
Обновить

Яндекс.Станция. Как мы создавали первое устройство с Алисой

Время на прочтение8 мин
Количество просмотров107K
Всего голосов 184: ↑168 и ↓16+152
Комментарии598

Комментарии 598

также поддерживает навыки от сторонних разработчиков.

Она сама может программировать?)

Сразу представляется плагин для Алисы от сторонних разработчиков (ФСБ)

А суть есть, что не от АНБ?

Меня во всех этих вечно включенных девайсах с микрофонами смущает постоянное подключение с интернетом.

Смартфоны, к сожалению, тоже…
А она смеётся по ночам дьявольским смехом?
Нет, она сама покупает в интернете, все что назвал.
Смеётся постоянно. И её даже не тошнит от баннеров.
image
Если только громко пукать или исполнять супружеский долг.
Учитывая политические реалии в нашей стране, очень боязно приобретать себе домой или на работу такое устройство полностью от российского производителя.
Процитирую коллегу:
как говорится, Алекса сливает твои переговоры рандомным людям, а Алиса специальным
В общем-то, именно для этого и создавалось это устройство. А под каким соусом его протолкнут — дело второстепенное
если бы его создавали кгбэшники, оно было бы похоже на кирпич и всё равно бы не работало.
на работе я бы вообще их запретил, это ж дыра в безопасности
ну хоть что-то у нас в безопасности.
Зато теперь есть выбор, кому сливать. Недопараноики США будут покупать Яндекс.станцию, недопараноики России — Алексу. Настоящие параноики вообще ничего из IoT не купят, включая кнопочную звонилку и пейджер — уже не раз убеждался, что мой смарт постоянно слушает, что рядом говорят и дает контекстную рекламу даже на вещи, о которых я не гуглил, но только говорил в контексте «купить»
мой смарт постоянно слушает

Ну это же нереально. Смарт бы жутко грелся и высаживал батарейку, если бы распознавал сам. Или бы генерировал заметный объем трафика, если бы распознавал в облаке.

А как тогда работает реклама, которая выскакивает после обсуждения чего либо в присутствии телефона? Это не паранойя и не бред, только в моем окружении уже десятки людей сталкивались. Самый последний случай у меня пару дней назад — обсуждаем наш с супругой отъезд и думаем где оставить вещи, я предлагаю оставить их на арендуемом складе, обсудили и отложили пока это вопрос. Ни я ни она не искали эти склады, но на следующий день яндекс директ пестрил этими объявлениями. И это происходит регулярно уже не первый год

НЛО прилетело и опубликовало эту надпись здесь
Да-да, конечно. Яндекс директ совершенно случайно начал показывать мне рекламу приставок на унитаз для людей после операции. И совершенно случайно это произошло ровно после обсуждения (но не гугла) необходимости покупки такой после операции по эндопротезированию сустава у мамы. А я просто накручиваю паранойю, ведь подобный товар — типичен для контекстной рекламы парню среднего возраста без проблем со здоровьем с техническими увлечениями и интересами.

Это просто один пример, но не единственный — уже раз десять обращал внимание, что контекстная реклама начинает мне предлагает весьма специфические вещи после устного их обсуждения.
НЛО прилетело и опубликовало эту надпись здесь
Они легко могут обмениваться данными между собой. И таки обмениваются, иначе невозможно объяснить релевантность предложений Яндекс.директ моим запросам в гугл, ведь яндексом я не пользуюсь…
НЛО прилетело и опубликовало эту надпись здесь
Еще раз: для поиска пользуюсь гуглом, при этом яндекс.директ дает релевантную рекламу. Иронизируй сколько угодно, объясни этот конкретный факт.

Ну и лично я работаю в компании, которая со своими прямыми конкурентами занимается взаимным инфообменом по заказам, впрочем, постфактум, когда заказы уже взяты и выполнены.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Ну кстати, я вот не паранойю, но черт возьми, как-то с другом пошутили о том, как покупать рельсы? Килограммами/тонами, километрами или ещё какие есть варианты? Такая 5-ти минутная шутка, поржали и забыли.
Через несколько дней, Яндес.Директ выкинул баннер о продаже рельсов в тоннах. Работаю в ИТ, с РЖД ни как не связан, последний раз ездил на поезде лет 20 назад. На электричке лет 5 назад. Периодически читаю посты на хабре, в т.ч. если они и на тематику железных дорог.
Но как все таки надо было подогнать пост о каком либо кривом приложении с покупкой билетов РЖД и ту самую шутку?
Интересная история, конечно. То что реклама всплыла только через несколько дней на мой взгляд может говорить о том, что тебе просто «повезло» и так совпало. Мне, например, всякую муть Яндекс метрика показывает, про которую я даже не говорил.
Друг потом не удержался и загуглил про рельсы, а Метрика определила, что вы друзья.
А как Метрика определила что друзья?
НЛО прилетело и опубликовало эту надпись здесь
И тогда, почему допущение, что Метрика, отслеживает и хранит, то с кем люди общаются, не вызывает беспокойства, а то о чем общаются вызывает? На мой взгляд и то и другое, за гранью конфиденциальности.

BarakAdama скажите пожалуйста, предположение о том что яндекс, отслеживает круги общения людей соответствует действительности?
Вы серьёзно? Люди сами по доброй воле в соцсетях всё-всё сами о себе рассказывают. И что любят, и с кем общаются, и где бывают, и чем интересуются. Никого уже давно это не парит, кроме единиц параноиков.
Ну так одно дело о чем человек добровольно рассказывает, и совсем другое, что собирается на него без явного согласия и разрешения.
В смысле без согласия? Почти уверен что в соглашениях это все есть. И удобно, таргетирование без усилий особых.
Прошу прощения, если что-то не до понимаю, но в контексте разговора про отслеживания кругов общения пользователя Яндекс Метрикой, в какой момент использования сайта третьей стороны пользователь соглашается на отслеживания кругов общения Яндекс Метрикой?
НЛО прилетело и опубликовало эту надпись здесь
Множественные совпадения показываемой рекламы и произнесенными до того вслух рядом с мобильным устройством словами наводят многих (не только меня и коллег, с которыми мы эти «фичу» подметили) на мысль, что даже без команды некоторые приложения от некоторых поисковых компаний слушают слова и складывают из них рекламный профиль присутствующих рядом. И это, повторюсь, просто с приложениями (которым нужно еще и канал и батарею экономить), а не с колонками/станциями, которые по определению слушают всё и всегда.
без явного согласия и разрешения
Многих людей знаешь, кто внимательно читает пользовательские соглашения перед соглашением с ними? Южный парк в тему, серия про ЧеловекАйпадоножну. Из более близкого есть прикол с соглашением на бесплатный интернет от Билайна — за час интернета ты даешь согласие на обработку твоего номера в течение 25 лет. Можешь, конечно, согласие отозвать — письменным обращением куда-то в офис.
upd: не заметил контекста — яндекс.метрика
А в какой момент использования сайта третьей стороны, пользователь соглашается на пользовательское соглашения Яндекс метрик?
Многих людей знаешь, кто внимательно читает пользовательские соглашения перед соглашением с ними?


А кто должен за них читать?

Привыкать нужно — новая экономика, доп. «сервисы» навязываются сплошь и рядом.

Сейчас до интернета доросло поколение детей, которые могут перемотать свою ленту до "мама и папа едут в роддом". Это дитя спрашивали родители, выкладывая его милые первые шаги в фейсбук?

Прикольно вы сравнили родителей и яндекс. Идеальная подмена понятий, я даже по началу купился. И все таки родители это оффтоп.
Если яндекс метрики собирают данные с кем человек общается, то это возможно тянет на нарушение частной жизни, которая по идее защищена конституцией в статье 23.
Это дитя спрашивали родители
Законные опекуны имеют право решать ЗА ребенка. Яндекс теперь опекает всех пользователей рунета? Или это аналогия с Большим Братом?
Не думаю, что система настолько продвинутая. К тому же показывать тебе рекомендации для твоего будет как то странно.
Чтобы показать рекламу на основании поисковых запросов друга нужно как минимум ещё какое-нибудь связующее звено тебя и твоего друга. А лучше даже не одно.
П.с. надеюсь понятно написал. засыпаю…

Вообще вся эта история с рельсами чем то на троллинг похожа. ИМХО.
С одной стороны, я, в первую очередь, просто пошутил. С другой, можно представить различные факторы, при которых такое будет возможно.
Дык тут же уже пояснили — #18706397
Да, я читал и видел. И даже постарался развернуть ответ… Ок, повторю ещё раз.
Это изначально была исключительно шутка для поржать, чисто для себя. Ни мне, ни моему другу информация о том как продаются рельсы нафиг не нужна, т.к. оба ни коим образом рядом с железными дорогами не связаны. Т.е. ранее не в этой сфере не работали, не работаем и не планируем когда-либо работать. На поездах не ездим. Возьмите любой пример на тему железных дорог и ответ будет — «нет».
Ни я, ни друг не гуглил. Ну я то точно, ибо в первую очередь лень, а во вторую мне это нафиг не нужно, т.к. вопрос себя исчерпал ещё на улице. Может оно кому то и интересно, но не мне. И поиском от яндекса/маил.ру/етц не пользовался.
На почту мне ни кто не слал предложений от производящих компаний, контрактов ни с кем не заключал. Компания в которой работал на тот момент была связана с розничной продажей бытовой техники.

В общем, единственное что объединяет ту шутку, рекламу от Яндекса это смартфон :)
Там ответ, по сути — «совпадение». Вы ж расписываете про что-то другое.
При этом, для меня это выглядит достаточно странным совпадением. Вот если бы мне жена написала в почту/смс «купи молока и хлеба» и неожиданно появилась реклама какого нибудь «Простоквашино», то тут ок. Паранойя в самом соку)
Если бы я работал в около ж/д тематике или в тот момент времени как-то интересовался данной темой, то это тоже можно было назвать совпадением. Кто знает как работают алгоритмы в директе и adwords…

Вот Вам часто реклама рельсов показывается, что бы посчитать её, чем-то обыденным? :)
Это антропный принцип же. Вероятность совпадения конкретно по рельсам конкретно у вас ничтожна, но на всей популяции почти гарантированно постоянно у кого-то происходит какое-то совпадение по какому-то предмету.
Совпадение — оно всегда странное, по определению. И я мало внимания обращаю на рекламу, так что про рельсы не отвечу.
Несколько месяцев назад так сложилось, что пришлось сидеть полчаса, прижав к уху чужой телефон-раскладушку (ни громкой связи, ни возможности воткнуть наушники, ничего нет), слушать мелодии и ждать, когда оператор освободится и примет уже этот очень важный для них звонок. Задолбавшись минут через пять, достал свободной рукой смартфон, загуглил приложение для слабослышащих (усиливает звук с микрофона и гонит в наушники), установил, положил микрофоном на динамик — хоть обе руки освободились, стало возможно чего-то делать на компьютере. Думал, мне после этого гугл начнёт подсовывать рекламу слуховых аппаратов, но чё-то неа. Никто, похоже, глухих клиентов не окучивает…
+1. Было такое же несколько раз.
А вы уверены что потом никому не рассказали в чате о шутке про покупку рельс? Или не писали о покупке рельс до этого ни на каком форуме или может быть вы или друг загуглил купить железнодорожные рельсы с того же IP? Я вот более чем уверен что объявление "купить рельсы, для железной дороги" у меня где-нибудь теперь да выскочит
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
И яндекс и гугл сейчас работают по https, а потому из заголовка HTTP Referer ничего кроме домена конкурента вытащить физически не смогут.
НЛО прилетело и опубликовало эту надпись здесь
Вроде HTTP Referer режется только при переходе https->http, но передаётся полностью при работе и сайта, и метрики по https.
Там ещё и яндекс и гугл их специально у себя режут, чтоб сайтостроители сторонними метриками не могли собирать информацию по каким запросам к ним пришли из поисковиков, мол хотите знать — ставьте нашу метрику.
Поправка. Не всегда режут, иногда шифруют поисковую фразу, получается, что Referer вроде как и есть, но поисковую фразу не достать.
Если не удается получить запрос через HTTP Referer, то достаточно проанализировать контент посадочной страницы. И такой информации будет достаточно!
Вы использовали одинаковый аккаунт хоть раз и там и там или подключились к рабочей сети с домашнего устройства.
Мы тоже замечали, что стоит обсудить какие-то темы рядом с телефоном на андроиде и появляется контекстная реклама. Так что не у одного у вас бред преследования такое случалось.
Реклама? Поставьте AdBlock и пусть чекисты-маркетологи играют сами с собой :)
НЛО прилетело и опубликовало эту надпись здесь
Не у меня реклама, просто заметили. Тому человеку плевать, он не парится вообще на тему слежки.
Этот пример очень показателен.

Когда люди тысячи лет назад не могли объяснить появление грома и молний, болезней или удачи, они объясняли это тем, что им было понятно: волей человекоподобного бога или богов, которые, как цари или предводители всем управляли. Зачастую верили и в то, что действия людей на земле могут вызывать дождь, к примеру. Сегодня мы знаем, что природа работает по-другому.

Развитие поисковых технологий сегодня дошло до таких высот, что человек тоже начинает объяснять это тем, что ему знакомо: что телефон подслушивает разговоры. Сложно поверить, что способы слежения совсем не такие очевидные и что по набору других параметров Яндекс может угадать предпочтения. А тут ещё и феномен Баадера-Майнхофа вносит лепту.

Думаю, что уже в самое ближайшее время, благодаря развитию Big Data и машинного обучения, мы встретим странные реакции обывателей: от неприятия и желания уничтожить до поклонения программам, как Богам.
А тут ещё и феномен Баадера-Майнхофа вносит лепту.

Что-то часто этот феномен стал упоминаться последнее время. Погодите-ка…
Потому что сожгли КультурноРазвлекательныйЦентр недавно. Это сценарий БаадерГрупп. Следующая фаза- похищение чиновника…
В теме обсуждения контекстной рекламы наблюдаю некую инверсию, порождённую школьным обманом: спрос рождает предложение. Весьма часто всё наоборот. Сначала есть факт производства, потом навязывания товара. Например есть избыток рельс. Владелец того избытка нанимает рекламщика продать рельсы. Тот лепит звук и надпись «рельс» в СМИ по всем направлениям и ориентирует сети на поиск корня «рельс», чтоб сужать эти направления, понижая расходы на показ. Люди попадают в гипнотическую обратную связь и в своей болтовне упоминают этот корень чаще. Службы контекстной рекламы выделяют направление упоминания и кладут туда рекламное объявление. Это повышает добротность воздействия. Это как вопрос: А вы уверены, что мысль пришедшая к вам в голову- ваша мысль? :-)…
> А вы уверены, что мысль пришедшая к вам в голову- ваша мысль?
— заметил как это очень хорошо используется в политике / CМИ / соц опросах.
НЛО прилетело и опубликовало эту надпись здесь
Только вот телефоны и рекламу создали люди.
А не были ли вы рядом с магазинами продающими эти товары или в специализированной больнице с телефоном?
Сейчас операторы собирают эти данные и потом перепродают, есть даже услуги от операторов по рассылке рекламы всем пользователям в опр. радиусе от необходимой вам точки.
В том то и дело, что я даже статьи по эндопротезированию не искал и все мед. процедуры родители самостоятельно проходили без моего присутствия. Но именно этот момент я могу списать на то, что родители искали эти приставки со своего компа, в котором НЕ ВЫПОЛНЕН логин в мои почты/соцсети, НО который находится в сети, к WiFi которого я постоянно подключаюсь.
НЛО прилетело и опубликовало эту надпись здесь
Пфф! Так с этого надо было начинать, а не выдумывать конспирологию про прослушку. Многие рекламные сети трекают по ip, это действительно так.
Так с этого надо было начинать
Ну вообще-то…
habr.com/company/yandex/blog/369353/#comment_18706417
Сначала пенял на гугл, потом на гугл родителей, комп которых в базах ассоциирован со мной
Реклама это результат анализа ваших покупок по пластику, ваших писем, вашего фейсбука, ваши близкие могут гуглить.
Это говорит о том что вас просто слушают
рекомендую проверить квартиру на предмет закладок скрытых микрофонов

До этого дня реклама была релевантна моим поисковым запросам — велосипеды, оперативная память, Израиль, психология, БИ 2, на концерте которых мы недавно были. И тут вдруг склады, на следующий день после обсуждения. Манией преследования не страдаю, к теориям заговора отношусь скептически, достаточно серьёзное психическое обследование проходил полгода назад (не по болезни, а по работе). И это только один случай я описал, а за год их с полсотни набирается только у меня.

НЛО прилетело и опубликовало эту надпись здесь

Я вижу результат в виде конкретных баннеров, и далеко не только я один, здесь уже отписались люди, которые сталкивались с этим, технологии вполне позволяют это сделать, рекламодателям это очень даже выгодно. Или вы можете доказать что это 100% невозможно и мне нужно пить успокоительные?

НЛО прилетело и опубликовало эту надпись здесь
Фраза «ОК, гугл!» выводит смарт из режима ожидания и включает экран голосового поиска. Вот тебе вся технология. Смартфоны УЖЕ умеют легко и непринужденно распознавать ключевую фразу и выполнять запрограммированные действия. Что мешает распознавать еще пяток ключевых фраз типа «купить», «найти», «хочу» и т.д. и отправлять статистику, какие слова пользователь произносит после этого? Синтаксис языка не такой уж сложный, да и люди строят фразы обычно однотипно, а не как магистр Йода, соответственно довольно легко из всего потока слов выбрать именно то, которое хочет «купить» пользователь.
НЛО прилетело и опубликовало эту надпись здесь
что важны не несколько слов, а контекст целиком

Язык не так сложен, как тебе кажется и люди обычно строят фразы относительно однотипно. Достаточно перегнать в текст кусок фразы, расположенный определенным образом относительно паттерна.
иначе это будет бесцельная стрельба в небо в надежде попасть хоть куда-то
А это разве не принцип работы big data? Метод не сработает на картавых и на магистрах Йода, но сработает на 90% пользователей, куда уж больше? Да и когда люди что-то обсуждают, то предмет обсуждения будет упомянут раз сто, мало ли это для точного определения предмета интереса?
НЛО прилетело и опубликовало эту надпись здесь
Еще раз. Я вижу смартфон, который включается при произнесении ключевой фразы, в том числе из другого конца комнаты, я вижу, что он легко печатает текст по моему голосу. В ходе обсуждения темы покупки я 100 раз скажу слово «купить» и предмет покупки. Какой принципиальный момент не позволяет моему смартфону, лежащему рядом на столе, распознать многократно повторенную фразу в окружении ключевых слов и отфильтровать её от «мусора»?
Так тут задача ровно обратная — нам не важны все остальные пользователи, нам нужен один конкретный.
Я о том, не вижу источника большого количества ложноположительных срабатываний и засорения собранной статистики.
Отключенный интернет? Мои опыты с голосовыми помощниками показывают, что без интернета их не хватает дальше, чем на пробуждение себя.
Диктовать в голосовую клавиатуру андроида при отключённой передаче данных получается довольно легко. (надо только локально пакет поставить)
>Смартфоны УЖЕ умеют легко и непринужденно распознавать ключевую фразу

Для эффективного распознавания ключевой фразы используются специальные чипы на платы.
Для эффективного распознавания ключевой фразы используются специальные чипы на платы.
И? Эти чипы аппаратно заточены под какую-то конкретную фразу или таки являются относительно универсальными?

Вы знаете русский? Значит переводить с финского на китайский сможете. примерно такая логика. Распознавание одной фразы (на самом деле нет — определённые паттерны, обилие false positive говорит не о распознавании).


Что мешает распознавать еще пяток ключевых фраз типа

Требуемые ресурсы, помножить на количество языков не забудьте, утекающий трафик (эти запросы не считает оператор?). И вообще — обязанность доказывать лежит на утверждающем, у вас из доказательств только типичные заблуждения, потому к вам так и относятся.

Фраза «ОК, гугл!» выводит смарт из режима ожидания и включает экран голосового поиска.

Ничего подобного по дефолту нет. Только при активированном приложении гугла, максимум — на экране рабочего стола с виджетом гугла. Опционально, если зайти в настройки, можно включить распознавание во время зарядки, а так же всегда, даже не на зарядке, при выключенном экране. При этом становится заметно возросшее потребление устройства.
Dragon NaturallySpeaking или что-то подобное лет 10 назад нормально работало и не слишком много ресурсов кушало.
НЛО прилетело и опубликовало эту надпись здесь
Ну если на то пошло, у меня телефон как не в себя жрёт. Жалко гугл не даёт возможности полностью выключать ненужный софт.
В тишине на ноуте у меня работало нормально, можно было музычку в плеере запустить, проблема была её остановить голосом))
В смысле кто-то из собеседников гуглил?
Мне показывается реклама вещи, которую я не гуглил никогда в жизни и лишь один раз обсуждал ее при встрече.

А, я знаю что вы скажете: мой собеседник гуглил, а яндекс или гугл нашли его в моих контактах на телефоне и теперь предлагают мне рекламу того, что гуглил или яндексил мой собеседник.
НЛО прилетело и опубликовало эту надпись здесь

https://ria.ru/technology/20150909/1240062909.html
Если такой баг был и подтвержден яндексом, то что мешает делать это умышленно? При разговоре телефон лежал на столе, и когда я общаюсь по громкой связи меня слышно с расстояния в метра полтора вполне хорошо. Распознавать всё слово в слово и не требуется, достаточно записывать хорошо расслышаные слова в память приложения и отправлять их маленькими порциями при соединении с wifi, чтобы это было незаметно по трафику

В случае с Навигатором быстро забивалась вся память записанными файлами, при этом они по сети никуда не отправлялись и не распознавались. А чтобы что-то распознать это надо в сеть отправлять. Локально распознавание не работает.
Работает. Должен пакет стоять
Полноценное распознавание только в облаке. Поиск геообъектов – более узкая и простая задача.
Я не про яндекс навигатор сейчас, а про аудионабор от гугла. Пакет для оффлайн распознавания русского языка весит 15 мегабайт, распознаёт в помещении надёжно, на ветру — довольно надёжно. Каких-то мегатекстов не набирал, но в задачник надиктовывал. Врёт в основном только в фамилиях.
Я не утверждаю, что яндекс так же умеет, но если не умеет, то зря.
Локальные библиотеки по качеству значительно уступают распознаванию в облаке. Особенно, если не ограничены определенной темой. Особенно (!!!), если речь про распознавание на больших дистанциях.

Хм. Прямо сейчас записал вот этот текст голоса, сим карта для чистоты эксперимента достал, файн файн выключен.


Собственно вот. Огрехи есть, конечно, особенно в слове "вайфай", но тем не менее вполне приемлимо. В облако залезть у телефона нет возможности, греться как сковорода он не стал, батарею в таком режиме держит долго, за полчаса наговаривания текста может 3-4 процента уйдет. Или вы хотите сказать, что эппл запихнул в iphone se нейросеть?

НЛО прилетело и опубликовало эту надпись здесь
Плюс вторая часть проблемы была в том, что в Андроиде доступ к микрофону монопольный, поэтому из-за этого бага перестал работать «окей гугл», что тоже вполне себе выглядит теорией заговора. Так что если какое-то приложение в фоне и будет что-то слушать, то другие приложения в это время не смогут пользоваться микрофоном – а это легко обнаружить.
НЛО прилетело и опубликовало эту надпись здесь
Вы обсуждали это в машине оборудованной глонас?
Вы с женой говорили? Жена искала, были в той же сетке, по айпи вам прилетело. У меня часто вылазит реклама товаров по ее специальности, сам я их точно не ищу.

Такого дофига — прилетает реклама и по IP (достаточнго кому из офиса погуглить) и по залогиненным сервисам (типа почты) — логин в двух местах, поиск в одном, реклама в другом. Не факт что реклама от второго случая не показывалась кому-то в первом (поиск дома, логин на работе, кому-то с того же внешнего IP показывается).

Подтверждаю, именно так и есть. Сначала пенял на гугл, потом на гугл родителей, комп которых в базах ассоциирован со мной, но уже убедился, что не нужно вообще ничего никому гуглить — достаточно лишь устно обсудить.
НЛО прилетело и опубликовало эту надпись здесь

Тоже было подобное, впервые обсуждали проект производства.


Даже не представляю как контекст подцепился, иначе, как благодаря либо подслушиванию, либо "аггрегации" интересов сидевших рядом людей с андроидами aka (с) BigData.

Есть еще и такая технология:

Android-приложения используют ультразвук для слежки за пользователями
Подробнее: www.securitylab.ru/news/486064.php

Можно передавать маркеры с компьютера или телевизора на телефон ультразвуком и наоборот.
Зачем телевизор? Хватит радио(автомбильного приемника а для тех кому лень — можно прямо в приложение стрим интегрировать) — play.google.com/store/apps/details?id=net.echotag.android.echotagapp2 именно так и работает.
В аудиопоток интегрируются неслышимые метки а если приложение их слышит из любого источника — показывает разные там викторины и рекламные баннеры. Сами метки — 3rd-party SDK.
Ага только устройство их фиг воспроизведет
Какое именно устройство? Как минимум на смартфонах тестовых — у меня эта штука работала. И не только у меня. С FM-радио — заказчик использовал.
Замечание — я НЕ утверждаю что там метка именно ультразвуковая.
Использовался www.digimarc.com/solutions/mobilesdk

Проведите проверяемый эксперимент. Поговорите сам с собой, чтобы точно никто ничего не искал. Тему выберите максимально далекую от всего, что вы гуглили последнее время.

Сейчас провел такой эксперимент, о результатах напишу :)
И как успехи?
НЛО прилетело и опубликовало эту надпись здесь
Видимо да, не стоит о таких вещах в интерне
В любом случае это нереально технически на данном этапе. Значит дело в чем-то другом. Возможно искали на ютубе, инстаграме? Или гуглили с совершенно другого девайса, но с одного айпи или просто географически рядом? Слышал ли разговор кто-то третий, кто тоже мог загуглить? Гуглили не склады, а просто что-то связанное с переездом? Гуглила жена, но не призналась.
Наконец, просто могло совпасть.

Я примерно понимаю как работают эти алгоритмы, и я исключил уже все возможности — жена не гуглила (смотрел историю поиска), я тоже, дома были мы вдвоем. Ничего связанного с переездом я не искал, так как ситуация возникла за 15 минут до разговора. Я не утверждаю с пеной у рта, что именно так все и есть, просто делюсь своими наблюдениями, и наблюдениями своих знакомых. И здесь уже многие отписали что сталкивались с такими ситуациями

НЛО прилетело и опубликовало эту надпись здесь
Я бы тоже посмеялся с этого камента или покрутил у виска, пока сам не столкнулся с прослушкой моим телефоном случайного разговора на улице на тему, которую я никогда в жизни не искал в интернете.

Тут уже определили, что на самом деле эту тему искал в интернете твой собеседник, а о факте вашего разговора узнали через совпадение геолокации и, вероятно, по идентификаторам BT ваших устройств. Хм, осталось придумать объяснение, как телефон узнал о ЧЕМ ИМЕННО вы говорили при встрече, не допуская версии о прослушивании телефоном окружающего шума. Ведь тогда весь предыдущий абзац можно выкинуть и оставить «телефон слушает»… Ну может рандом великий помог и тебе просто решили задвинуть случайный интерес твоего собеседника.
Я готов лучше поверить что так и было, чем то, что мой телефон постоянно пишет разговоры.
Никакой батарейки не хватит постоянно писать разговоры и передавать их в инет.
Только что такое было, пообсуждали блокчейн и оп-па — реклама яндекс-директ. Хотя, если подумать хоть чуть и вспомнить, то эта реклама была и неделю и две назад, просто забылось, а была она, видимо, от хабра, где периодически открывал статьи про издевательство над очередным ICO. Вот он, феномен «Феномен Баадера-Майнхоф», также известный как «феномен синей мазды».
PS. А ещё там были склады, машины и помещения в аренду, хотя их не обсуждали (помещение, скорее всего, кто-то гуглил). Представляю что поговорим о переезде и кто-то, внезапно, обратит внимание на рекламу — вот и готовая байка типа вашей.
Фраза «ОК, гугл!» распознается телефоном в режиме ожидания. Именно эту функцию надо включать вручную, но когда я баловался этим ассистентом, особых изменений во времени автономной работы я не замечал. Что мешает работать этой прослушке из коробки, распознавая ключевые слова потенциального покупателя? Тем более, что уже хватает случаев включения нужных и удобных функций без спроса пользователей (и хорошо, если делаю кнопку для выключения)
НЛО прилетело и опубликовало эту надпись здесь
Мне кажется, ты кроме 3310 ничем не пользовался, но рассуждаешь о уровне современных смартфонов. Голосовой ввод текста никогда не использовал? Если у тебя нет проблем с артикуляцией, то работает отлично. Распознавать тысячи паттернов не надо, надо несколько слов, сопровождающих намерение купить, которые запустят распознавалку фразы следующей за этим (или в другом месте фразу, в зависимости от языка) паттерном и отправят распознанное. Все.
НЛО прилетело и опубликовало эту надпись здесь
Голосовой ввод используют держа телефон в руке перед собой, а не откуда-то с другого конца комнаты
Мне лень гуглить, но вроде уже дали название патологии, когда человек из рук не может выпустить свой смартфон. Надо ли вообще пытаться подслушивать из другого конца комнаты, когда достаточно научиться слушать со стола экраном вверх (все ведь следят за уведомлениями)?
В статье рассказано, каких усилий стоит обучение всего одной фразе.

Вообще вопрос широко обсужден в англоязычном интернете. Ключевые слова для поиска «facebook app listens to your conversations»
И первая же ссылка ведёт на реальный тест, где шесть человек специально обсуждали определённые темы рядом с телефоном, но не искали их в Инете, а в последующие дни следили за получаемой рекламой. Никто не получил ничего таргетированного.
К сожалению, реально.
Ну это же нереально.

Когда это останавливало религиозных фанатиков? :)

Злобный Директ, который прорывается сквозь адблоки (но не очень раздражает) через 5 минут после голосового обсуждения разницы между слитками и инвест монетами предложил купить монеты.
Наверное потому, что я о слитках плохо отозвался.
Вас услышал баннер на сайте? )
С учётом того, что я залогинен в яндекс и в телефоне и в ноуте, то да ;)
Не представляю как, с учетом того, что доступа к микрофону у него нет.
Я тоже в это не верю, но факт налицо. Плюс знаю об одном эксперименте — народ заранее договорившись обсуждал чисто голосом фильм — получил рекламу в тот же вечер.
С другой стороны — я в детстве проверял, существуют ли гарантийные человечки Успенского в реальности. По книге ромашка на километровом столбе должна тормозить грузовики. Итог — три грузовика за день. Гипотеза успешно подтвердилась.
Confirmation bias же.
НЛО прилетело и опубликовало эту надпись здесь
Сори, если об этом писали, но айфон и, наверное, андроид умеет слушать всегда на предмет «Привет, Сири». А запросы с этой информацией необязательно слать постоянно, чтоб грелось и сажало батарейку.

А вообще, мне в это не особо верится просто потому, что об этом давно бы узнали. Легко ведь проверить, куда и что шлет смартфон.
НЛО прилетело и опубликовало эту надпись здесь
Вот кстати да
Я на своем Z3 удалил штук пять системных процессов, содержащих в своем названии что-то вроде anonymous stats (нет, не параноик, грохнул их в рамках общей чистки системных приложений — смог высвободить полгига памяти у системного раздела в пользу пользовательского). Ну а gapps вроде и так постоянно все подряд шлет на сервер.
а скандал будет такой, что страшно подумать

Какой скандал будет? Гугл в своих политиках открытым текстом говорит, что собирает всю информацию, какую только можно, а пользователь с этим согласен. Чем сбор интересов пользователя путем ожидания ключевых слов и записи в статистику слов, сказанных сразу после них, отличается от анализа активности какого-либо IP-адреса?
Поэтому нет смысла искать заговоры там, где все можно объяснить простой наукой :)
Любопытно, что с обоих сторон наблюдается буквально одна и та же религиозная убежденность в своей правоте. Ты продолжаешь держаться за тезис, будто смартфону нужно 24/7 слушать окружающий шум и подвергать его сложному анализу, что сразу его разрядит, совершенно игнорируя или давая КРАЙНЕ НЕВНЯТНЫЕ отговорки от того ФАКТа, что смартфон и так слушает 24/7, ожидая команды активации голосового помощника и катастрофически на его аккумуляторе это не сказывается. Я так и не увидел аргумента, что мешает вместо одного ключевого слова использовать десяток? При том, что «тайные» ключевые слова НЕ НУЖНО распознавать с высокой точность — пусть хоть иногда ловит.
НЛО прилетело и опубликовало эту надпись здесь
и как это связано с обсуждаемой темой про скрытую прослушку без согласия пользователя?

Тем, что единственный предусмотренный производителем способ отказаться от этих приложений — выкинуть телефон. Ты либо используешь смартфон и таскаешь вместе с ним парк сборщиков статистики, которые не можешь явным образом выключить (в меню приложения кнопка «Отключить» чаще всего недоступна), либо не используешь смартфон вообще.
что скрытые средства прослушки во многих странах явно запрещены законодательством
Тебе сколько еще раз повторить про активацию смартфона при произношении ключевой фразы? Это уже значит, что он слушает происходящее вокруг постоянно (речь не передаче данных, просто о факте анализа шума и факте, что микрофон постоянно активен). Я все больше убеждаюсь, что из нас двоих именно ты — религиозный фанатик, иначе игнорирование фактов я объяснить не могу.
распознавание произвольной речи — это совершенно разные задачи
Тебе сколько раз еще повторять, что не нужно распознавать произвольную речь в полном объеме. Распознай два слова, следующего после ключевого — ты уже соберешь львиную долю нужной информации. Я с самого начала указал, что люди фразы строят типично и обычно говорят «Хочу купить чемодан», а не «Чемодан мне подумалось в следующем месяце для поездок за границу купить». Активируйся по слову «купить», запиши следующее за ним — «чемодан».
Или ты сейчас начнешь доказывать, что ключевых фраз физически не может быть больше, например, пяти (Сири, Гугл, Яндекс, Алиса, Алекса), а на большее современные технологии в принципе не способны?
слов активации часто вообще перенесено на отдельный чип, как раз чтобы не жрать ресурсы центрального процессора
И как это противоречит гипотезе активации по ключевым словам?
НЛО прилетело и опубликовало эту надпись здесь
какое это имеет отношение к постоянной негласной прослушке
Такое, что о негласной прослушке в контексте передачи всего услышанного из нас двоих говоришь только ты. Я же писал о том, что телефон штатно установленными приложениями шлет кучу разных данных, независимо от желания пользователя передавать эти данные (при условии, что он будет использовать смартфон именно как смартфон)
И речь-то как раз о передаче данных
Ты сам задал такой вектор рассуждений. Я изначально использовал слово «прослушать» в буквальном, можно сказать, физиологическом смысле — у телефона постоянно активен микрофон и он анализирует (хотя бы в минимальном объеме) получаемый шум. Этот тезис ты старательно игнорируешь и не обсуждаешь, пытаясь уехать на тему передачи данных или доводя гипотезу до абсурда, выводя невозможность круглосуточного полноценного анализа звука, хотя только ты такой анализ и заявляешь.
1. это очень легко отследить по сильным всплескам загрузки ЦП определенными процессами
Ну может мы сейчас дали тему для диплома выпускника кафедры ИТ-безопасности, кто знает. Может это еще не проверяли. А может эти всплески в море других всплесков теряются, остается ли вообще процессор современного смартфона совсем без нагрузки хоть на минуту?
у людей, работающих в сфере продаж, подобный триггер будет срабатывать постоянно
Наконец-то, адекватный аргумент. Действительно, так и будет. Впрочем, мне интересно, будут ли еще сообщения от пользователя, который где-то тут по соседству написал о проведении эксперимента.
НЛО прилетело и опубликовало эту надпись здесь
если пользователь был предупрежден и принял соглашение
ЧеловекАйпадоножка, ага, знаю. Покупаешь телефон, включаешь, читаешь соглашение, выключаешь телефон, отдаешь в магазин :)
но и передает собранные данные производителю для анализа генерации таргетированной рекламы, разве не так?
Т.е. по твоему нет разницы между «передавать статистические данные анализа аудиопотока микрофона» и «передавать весь аудиопоток микрофона»? Ты много комментариев подряд настойчиво упираешь на последнее.
НЛО прилетело и опубликовало эту надпись здесь
Вы знаете, у меня раз такое было: говорил о пробках на дорогах и после разговора Google Now показал мне информацию о пробках. Может быть и совпадение, но голосовая активация на OK Google существует, значит телефон все равно слушает в ожидании этой команды. Другое дело что это все не может передаваться на сервера постоянно.
Я по лампочке на роутере вижу когда что-то происходит. Моргает = что-то происходит.

Блин. А я купил SIM800 и им, как стационарным телефоном пользуюсь.

А ещё он из кармана вылезает и фоткает, но вы не видите, потому что он это делает пока вы не видите.


Они легко могут обмениваться данными между собой.

Очевидно что это не так, вы абсолютно не в курсе реального положения вещей и берётесь судить о мире. На самом деле (говорю по большому секрету, главное не читайте в присутствии телефона) они все подразделение копрорации Ящерики Ltd.

...

molodoy_chelovek_proydemte

Заголовок спойлера
image
Товарищу майору нет никакого смысла копаться в гигабайтах аудиозаписей, когда он может открыть отечественную соцсеть и нарубить себе «палок» гораздо быстрее. Это если вы обычный рядовой гражданин. Тук как в анекдоте про медведя: не надо бегать быстрее медведя, надо бегать быстрее большинства остальных бегущих.

А вот если вами уже заинтересовались (допустим, вы фигурант по какому-то делу или крупная фигура) — тут, вероятно, и голосовыми данными не побрезгуют.
При всей ненависти к государственной слежке в любой ее форме — это уже надо воспринимать как данность. Ни одно уважающее себя государство не откажется от такой замечательной возможности подслушивать своих граждан (тем более «взакрытую»). Это не в России проблема — это в концепте власти как таковой проблема.

Да и будем честными — идеалы анонимности в интернете давным-давно порушены. Мы используем телефоны с интернетом (геопозицию которых можно триангулировать по сотовым вышкам), банковские карты (логирующие все транзакции), ездим на поездах и летаем самолетами (с историей перемещений)… Неважно, сливаешь ли ты всю эту информацию своему государству напрямую или через условный Яндекс.Девайс — если им понадобится, они узнают все, что им потребуется.
Слышал сегодня по «Бизнес ФМ», что как раз киллер-фича этой колонки в сравнении с конкурентами — аппаратно отключаемый микрофон.
Всё так.
Но мультиметром никто проверить не дал. При этом, про отключаемый микрофон почему-то говорят в единственном числе, хотя их там несколько
Очень смешно. Конечно же, все микрофоны сидят на отдельном контуре питания. После выхода устройства можно будет собственными руками всё проверить.
Кнопка аппаратная, т.е. переключатель размыкает цепь физически? Или кнопка программная, посылает сигнал схеме разорвать питание?
Выйдет устройство — его разберут и точно скажут как там устроенно… Подождите…
Нет, там всё надежнее. Кнопку невозможно программно испортить. Вот принципиальная блок-схема. А тут подробная схема с комментариями.

image
Учитывая политические реалии в нашей стране, очень боязно приобретать себе домой или на работу такое устройство полностью от российского производителя.


А у вас есть свои интересы в нефтяной промышленности или в политике?
P.S.:
Устройства из страны с куда как большими финансовыми возможностями — вас не смущают?
Ну теперь не только китайцы и американцы будут знать что я говорю но и наши :)
Лето этого года :)
Тоже подписался на уведомление. Можно узнать, а для пожилых людей планируются там полезные фичи? SDK будет доступен к моменту выхода?
А какие например?
«Алиса, мой внук сегодня поел?»
«Куда я положила очки?..»
Не рекомендую никому использовтаь эту колонку, Яндекс — в реестре распространения информации => он будет передавать любые данные по первому запросу.



PS Яндекс, а не пора ли вам уже сменить юр.лицо? а то у вас одни фейлы последнее время, чего только яндекс.новости стоят
Хотел написать похожую вещь, это фактически установка дома «жучка», причем не важно что скажут люди из яндекса, очевидно, что у них нету выбора.
почему у них нет выбора? они могли полностью объявить уход из россии, переводя офисы и дата-центры. Они бы остались в рускоговорящем сегменте (СНГ) но ушли бы из этой страны.
Это фактически сразу блокировка от роскомсамизнаетекого, как следствие потеря самого большого русского рынка. Очевидно, что на такой риск никто не пойдет.
Так у РКН будет выбор: при блокировке все пойдут в гугл сервисы =)

А если яндекс хочет себе карму почистить — пора предложить во всех своих сервисах понятную опцию как можно переключится на использование зарубежного ДЦ (а он у них есть да), примерно так же сделал Apple. когда их обязали хранить часть информации на территории китая. Были вполне четки инструкции как перенести свой аккаунт в другую страну, что бы не попадать под закон.
Зачем ему карму чистить, у него и так всё хорошо.
> Так у РКН будет выбор: при блокировке все пойдут в гугл сервисы =)

sputnik.ru
Только похоже его слить решили, всякие интересности типа цен на лекарства уже убрали (и веб, и приложение).
Как только яндекс сбежит — он расцветёт аки ТамТам в апреле
Кто вам сказал что СтукСтук расцвёл?
НЛО прилетело и опубликовало эту надпись здесь

Посмотреть количество скачиваний Вы можете самостоятельно

НЛО прилетело и опубликовало эту надпись здесь

Я заявил о расцвете в апреле, я показал расцвет в апреле.


Если у вас есть иное мнение — Вы тоже можете его чем-нибудь аргументировать. Лучше чем-то посерьезнее, чем «вывсеврети!!»

НЛО прилетело и опубликовало эту надпись здесь

Тяжелый случай. Это была четвертая «версия утверждения» только в этом треде.

ТукТуком обязали пользоваться в одной достаточно большой компании (30 тыс. работников). Плюс обязали пользоваться во всех компаниях, которые принадлежат тому же владельцу, но формально в холдинг не входят (а это еще примерно 100 тыс).
Сколько из сотрудников стали пользоваться — вопрос. Среди коллег все как сидели в ТГ, так и сидят. Ну и дубли бесед (чатиков) у кое-кого появились в ВА на личных устройствах.
Они же анонсировали, что есть кнопка, отключающая питание микрофонов. Проверить это экспериментально не составит труда.
те вы предлагаете купить устройство и не пользоваться им? а можно уточнить зачем?
На время тех разговоров, которые комментаторы выше хотят оставить инкогнито, микрофон можно отключать. На мой взгляд, это отличное решение у Яндекс.Станции.

Только не надо забывать, что динамики по своей природе те же микрофоны...

И жёсткие диски.
Во-первых, это колонка и видеоплеер. А потом уже голосовой помощник (игрушка).
хм… я как раз из-за Алисы сюда зашел. Думаю её к Home assistant прикрутить.
Потому что стационарная моно-колонка в форм-факторе пукалки — это ж позор какой-то… Зачем такое дома ставить, если звучать будет хуже, чем пищалки у телевизора? Медиаплеер который не проиграет мне любой блюрей с интерфейсом и настройками, к которым уже привык, тоже не особо нужен.
Вроде как Яндекс изначально голландская компания.
Яндекс.Новости подстраиваются под страну, что хорошо видно если через Тор ходить. На украинском варианте главной Яндекса новости про ОРДЛО (да, именно в таком написании), на российском ехал Путин через Путин. Ну либо там как то автоматом агрегируюся преимущественные настроения в СМИ страны посетителя.

В принципе я даже не готов их за это осуждать, чистый бизнес, ничего личного.

P.S. Опять же начнем с того что журналистика, кмк, в полной ж, с точки зрения непредвзятости и доказательности. Если изначальный материал отстой то как ты не агрегируй его конфетку из него не сделаешь.
НЛО прилетело и опубликовало эту надпись здесь
1. Не понимаю, чего именно вы боитесь. Станция не транслирует и не хранит весь звуковой поток в сети. Она локально реагирует только на «Яндекс» и «Алиса». И только в этом случае отправляет команду в сеть для распознавания, где даже эта команда хранится в обезличенном виде. Верить в это не обязательно – это всё легко проверяется при желании.

2. Про реестр мы тоже на Хабре писали – habr.com/company/yandex/blog/237395 Там тоже не так всё работает. Но п.1 вам проверить будет легче.

P.S. И небольшой пример по теме.

Уже был скандал с Alexa, дайте угадаю, ваша колонка имеет удаленный механизм авто-обновления? Следовательно в любой момент мне может установится «правильная» прошивка.


Я бы очень хотел вам доверять, но в связи Последних событий — это очень сложно. Мне кажется вы бы смогли заслужить доверия если бы выложили всю прошивку в OpenSource (без серверной части)

Прошивка в OpenSource — неплохая идея. + инструмент валидации и сравнения прошивки, стоящей в колонке, и прошивки, лежащей на сайте для всеобщего обозрения.

Вот вот! Причём это был бы вызов Google/Amazon и возможно яндекс бы смог использовать тему телеграмма «мы за приватность» показав код общественности.

Думаю Яндекс выложит прошивку в opensource, как только это станет общепринятой практикой. Так что подождём когда это сделают Google, Amazon и Apple.

Если меня прослушают через Google колонку я уверен, что это максимум к чему приведет — к справедливому суду, а чуть позже — с многомиллионным искам в сторону гугл. а вот тут я не в чем не уверен.
Расскажите об этом Джонну Банну, который 17 лет отсидел, только потому что судья не стал придираться к показаниям свидетелей, и наделил чернокожего обвиняемого правом подходить под описание «белый подросток».
НЛО прилетело и опубликовало эту надпись здесь
с другого конца шарика они мне ничего не могут, не был я там никогда и не собираюсь, да и нафиг я им нужен вообще.
Это пока вы за пределы РФ не выезжаете.
НЛО прилетело и опубликовало эту надпись здесь
Показательно наказать за нелояльность или выполнить план (а тут ты случайно попался под руку), отжать успешный бизнес, или же ты просто перешел дорогу одному важному и уважаемому человеку…
Ровно те же примеры можно найти относительно Иностранных спецслужб в отношении граждан как своей, так и других стран: задавить, запретить, отчитаться.
НЛО прилетело и опубликовало эту надпись здесь
Пока же участники всех нашумевших дел, ..., были сами крайне мутными личностями, успевшими очень ярко засветиться в весьма грязных делах.
Такое же утверждение я могу дать и для наших «громких дел»

Насчёт появлений в прессе, так появляется. И в прессе и в интернете. Например полицейские в США, уходящие от ответа после убийства. Это уже в массовую культуру там просочилось прочно. Или вот возмущение сегодня в ленту ко мне пришло по поводу справедливости суда (подробностей я не знаю) twitter.com/kenklippenstein/status/1001203708485611524?s=20

Пока у вас уверенность, что это вас не касается, мозг игнорирует такую информацию. Кажется, что её либо нет, либо намного меньше.
НЛО прилетело и опубликовало эту надпись здесь
все бы ничего, но с одним из участником подобного дела я одно время довольно хорошо был знаком лично, поэтому основываюсь не только на статьях из СМИ.
Я знаю одно дело, которое пытаются назвать политическим, и о фигуранте хорошо отзываются все друзья, родственники и сми. Но вот про наличие чёрной бухгалтерии мне тоже известно (хотя вменяют не это).

Или другой пример. Мной лично интересовался сотрудник ФСБ в целях набрать звёздочки. И… ничего не было.

Одиночные примеры не работают в данном случае. Ошибки есть всегда.
Глупо, есть очень много гораздо более легкой и вкусной добычи.

Согласен, что глупо — однако же случается. Погуглите про Станислава Лисова.
НЛО прилетело и опубликовало эту надпись здесь
Ну просто как бы коллеги, которые были с ним знакомы(в том числе — его сестра) — утверждают, что ничем таким он не занимался. Я пока что их словам доверяю больше.
НЛО прилетело и опубликовало эту надпись здесь
Ну как мне кажется — знакомые, а особенно родственники должны были заметить изменения в благосостоянии, к примеру, ведь утверждается, что он на этом зарабатывал.
С какой целью это будут делать иностранные службы в отношении меня?

С целью наработать базу полезной информации. Которая будет лежать, пока кому-то не понадобится за какой-то надобностью "белый холостой мужчина 30 лет, русский, среднего достатка, ездит на синих жигулях", после чего ФИО, подходящее под такой портрет, достаётся из базы и начинает разрабатываться.


Спецслужбы любого государства, например, дорого бы дали за "список людей государства X с профессией "военный", в течение прошлого года обращавшихся более одного раза за микрокредитом и не вернувших тело хотя бы одного кредита". То есть тех, кто потенциально имеет допуск к секретам и не откажется от "небольшой финансовой поддержки"

Не выложит как минимум до момента открытия публичного API Я.Музыки. Я общался с поддержкой Яндекса — такого API нет и не планируют. Придется мне для своей умной колонки дружить Алису с Deezer(((
Не обязательно обновлять прошивку, достаточно активировать функцию для нужного пользователя.
А как это легко проверить, если у меня есть такое желание (что каждая команда в обезличенном виде и звуковой поток не хранится)?
Во-первых это в обычном режиме она будет отправлять пакеты с запросами только по команде, а в другое время совсем ничего не отправлять мееедленно (но это совсем не доказуемо, так что проехали).
Как например легко отличить отправку архива накопленных данных пачкой при первом следующем обращении «Алиса» вместе с этим запросом?
Вам же и предлагаают я так понимаю раскрыть структуру клиента, чтобы можно было хоть примерно оценить, что она отправляет.
Боюсь, что даже в этом случае можно придумать фантастические варианты в пользу любой теории.
НЛО прилетело и опубликовало эту надпись здесь
Тогда это кто-то заметит. Даже безобидные наши баги обычно быстро замечают.
НЛО прилетело и опубликовало эту надпись здесь
эта команда хранится в обезличенном виде

Да ну. Команды и записи голоса разве не привязаны к я.аккаунту и не хранятся для таргетинга, обучения системы под пользователя и всего прочего..?
Кажется очевидным, что государственный переворот лучше обсуждать вдали от подобной электроники и неприглашенных людей.

P.S. Почему в более-менее технической статье обсуждают опять политику?

Да какой там переворот, полно более безобидных вещей, которые не стоит доверять таким колонкам.

Почему переворот?
Вот будете пересылать своему другу в телеграм что-то, колоночка услышит и куда надо запишет/сообщит.


Да все что угодно (плохого) можно сделать...

переворот лучше обсуждать вдали от подобной электроники

Проблема в том, что это мы с Вами как технари понимаем возможности "подобной электроники", а для хомячков со средним гуманитарным образованием это всё магия, и о том, что куда может сливаться и к чему это можент привести, постоянно становится "приятным" сюрпризом.


Иначе не было бы террористов, обсуждающих свои планы в SMS-сообщениях открытым текстом.


(Правда, спецслужбы ничуть не лучше, поскольку обнаруживают эти самые сообщения уже после терактов.)

Не ставьте её на кухне.

Мне её на кухне и надо ставить. Я там бываю раза 2 в день по 5 минут.
Ну так-то и хабр там же…
"- Ок, Алиса, отправь товарищу майору ключи от Телеграмма"
Обычно и твитеры (высокочастотные динамики), и вуфер направляют в сторону слушателя, чтобы добиться минимального искажения звука.
Зависит от конструкции акустики. В классической конструкции динамики направляют в сторону слушателя не из-за искажений, а из-за направленности звукового давления. У вас используется конус для рассеивания звука на 360 градусов, в такой конструкции обычно ставят динамики в горизонтальной плоскости. И кстати, почему вы «твитеры» не сделали с подобной конструкцией?
Shut up and take my money.jpg!
А если серьёзно, что на счет цены?
а вдруг...
ну и про анонимность что-то не очень верится в современных реалиях.
9990 рублей
150$… на мой взгляд вполне гуманная цена за такой девайс.
С DLNA сервера она сможет видео на телевизор играть?
А будет ли версия без включения всяких подписок в стоимость? Для Москвы может цена и нормальная, но для регионов это слишком.
Читать книги она сможет?
Судя по цене, устройство будет продаваться в «Эльдорадо».
А можно спросить: что в вашей колонке круче, что она на $60 дороже Alexa и на $20 дороже Google Home?

Иными словами: этому есть какая-то объективная причина (например, дороже «потроха») или просто следование классическому «на российском рынке все должно быть дороже»?
1. Акустика совершенно другого уровня.

2. Возможность проигрывать видео, т.е. железо с запасом по нагрузке ещё и для этого кейса.



Спасибо за ответ. Версию для нищебродов в будущем планируете? Что-то вроде Home Mini. $150 при региональной зарплате в $350 мало себе кто сможет позволить отдать, например, а это очень большой рынок (хотя я и не уверен, что он целевой).
Посмотрим по ситуации.
НЛО прилетело и опубликовало эту надпись здесь
Ни с партнерским контентом, ни с видео из свободного доступа в сети проблем не было.
А проигрывать видео из своих источников сможет?
А телевидение? Свои плейлисты для iptv?

Другими словами — сможет заменить медиаприставку для тв?

Если Эппл вдруг выпустит свою колонку, то акустика уже не будет таким вау-фактором.

Добро пожаловать в 2018, уже 2-е поколение хоумпода от эпл вышло
2 поколение? Я что-то пропустил? Не было никакого второго поколения

Да я вообще-то и первого в глаза еще не видел, поэтому и думал, что Apple забил с выпуском. А, оказываются обещают что-то в середине июня в Европе представить.

ничего представлять не будут. Просто запустят продажи. До 18 июня HomePod продается только в США

Собирается в Китае?
Какой объём первой партии в штуках планируется?
И какой будет промежуток между 1 и 2 партиями?

Да, собирается в Китае. Про партии пока секрет.
А можно будет отключить активацию по «Алиса»? У меня дочка Алиса, но колонку я очень хочу. «Яндекс» будет достаточно.
Да, можно отключить «Алису», но оставить «Яндекс».
А если, вдруг, внезапно у кого-то одного ребенка зовут Алиса а другого, прости господи, Яндекс, как тогда быть? =)

А вообще мне колонка понравилась, правда ценник напряг.
А если детей двое и зовут их Алиса и Яндекс? :D
P.S. Чёрт, надо было страницу обновить, прежде чем писать.
А можно, чтобы Яндекс.Колонка откликалась на фразу "Товарищ Майор"? Так будет аутентичнее…
Нет.

Можно, но паять придется, а так распознаешь "Товарищ Майор", и посылаешь на место микрофонной матрицы "Алиса", достаточно иметь АЦП, сигнальный процессор(для частотно-временного преобразования), МК(там нейронка или SVM для распознавания, да хоть просто корреляторы) и ЦАП. Можно отпаять матрицу, присоединить к этому устройству и дальше эмулировать ее. Придется повозиться(и сильно), но сделать можно все :)

И хочешь найти фразу из каких "Улиц разбитых морд", "Товарищ майор, у нас труп", а поиск выдаёт "Алиса, у нас труп" (и ведь находит).

У меня тоже дочку Алиса зовут. Добавьте пожалуйста возможность распознавания других слов, кроме Яндекс.

Про Алексу ходила шутка-рекомендация, что если девушку тоже зовут Алекса, то проще сменить девушку.
С дочкой сложнее будет :)

"Алиса! Миелофон! Космозоо!"

На самом деле очень рад за Яндекс! Возможно, к моему семейству Google Home и Alexa присоединится ещё и Станция :-D
А они ведут между собой беседы?)
Кстати, не пытался их «стравливать» друг на друга :-D Надо попробовать)
Я пробовал, не сильно хорошо, но кое-что получается: www.instagram.com/p/Bfq2tMclP62
Хороший вопрос — есть ли синхронизация как в Алексе. Или можно ли дать колонке своё имя, чтобы говорить: «Продолжи играть на кухне»
Не должны.
Причём они подключены к отдельному контуру питания, и когда вы нажимаете кнопку Mute на корпусе, микрофоны физически обесточены.

Хрень это всё, байки для домохозяек. Единственный гарантированный вариант это физический переключатель который разрывает контакт физически. А кнопка, она же программно управляется. Т.е. при желании ее можно и програмно включить без каких либо проблем.
Можно разобрать и легко протестировать.
Это ничего не докажет. С очередным обновлением или хакером кнопка может вдруг перестать отключать микрофон.
Это уже совсем какая-то фантастика. Мне кажется, доказывать надо обратное.
Если контроллер опрашивает кнопку и на основе её состояния рулит транзистором питания микрофонов — никакая не фантастика. Не отключать питание тут ничего не мешает.
Вот если кнопка подключена напрямую к базе\затвору(скорее всего, полевик), тогда да, всё ок.
Кнопку невозможно программно испортить. Вот принципиальная блок-схема. А тут подробная схема с комментариями.

image

Возможность обновления по воздуху, имхо, вообще доказывать не надо, выглядит очевидным, что оно будет.


А желание местных органов знать больше, чем вообще можно было бы вообразить — ими тщательно доказано. Их доступ к информации ограничен больше технически, чем юридически. Никаких юридических препятствий для них нет. И вопросы чести, совести, репутации самого Яндекса вряд ли их будут интересовать.

И что доказывает один мутный факт?)
Одному требованию отказали, а десятерым другим нет).
Ну и на самом то деле, не органы страшны сами по себе. Этим ребятам обычные люди не особо интересны.
Гораздо больше волнует вопрос неконтролируемого доступа третьих лиц. Т.е. всяких админов и прочих технически подкованных (по простому хакеров :) ) товарищей, которые используя либо административный ресурс, либо технический смогут добраться до колонки конкретных интересных им людей.
Доказывает, что препятствия всё же есть ;)

С точки зрения абстрактного риска с хакерами, телефонами тоже нельзя пользоваться.
Этим ребятам обычные люди не особо интересны.
Яндекс в рамках закона отдал список тех, кто, кто отправлял деньги неким оппозиционым политикам несколько лет назад. Если эти люди подходят под определение «обычные», конечно.
Вот так перечислите деньги не тому, кому можно, выпишут санкцию суда на прослушку с колонки, и отдадут её на аутсорс бабкам из «отрядов путина» или кто там сейчас вместо «наших». :-D
Ох уж эта фантастика. К Станции нельзя подключиться снаружи. А ещё тут отдельный контур питания на микрофонах – отключить можно в одно нажатие.
НЛО прилетело и опубликовало эту надпись здесь
Это уже третий круг этих претензий. Выбей себе эту колонку для обзора нахаляву, сделай вскрытие, да опубликуй обзор с разбором этой кнопки и обвязки питания микрофонов, имеет контроллер к ним доступ или нет.
НЛО прилетело и опубликовало эту надпись здесь
Автор статьи уже раз пять сказал, что выключенные микрофоны сами не включатся. Дай тебе схему, ты скажешь, что не веришь, что в железе именно так будет сделано. Хотя да, с тестовым образцом для обзора тоже можно предположить, что это спец. ревизия без Майора, а в продажу пойдут другие.
Нет, там всё надежнее. Кнопку невозможно программно испортить. Вот принципиальная блок-схема. А тут подробная схема с комментариями.

image
НЛО прилетело и опубликовало эту надпись здесь
А можете мне объяснить почему вы видите это хорошим решением?

В разомкнутом состоянии кнопки вход триггера 1CLK управляется цепью MUTE_BUTTON. В замкнутом состоянии кнопка подтягивает вход 1CLK к 3.3В. Именно подтягивает, а не садит на землю. Опять же получается, что триггер полностью в программном управлении по MUTE_BUTTON.

Если MUTE_BUTTON настроен на выход, то только он управляет 1CLK, а состояние кнопки не имеет значение.

Кстати, ещё вот так просто взяли и зашунтировали перемычкой стабилитрон.
НЛО прилетело и опубликовало эту надпись здесь
Интересный вопрос: зачем ставить стабилитрон перед базой биполярного транзистора, зажигающего красный светодиод и работающего в ключевом режиме от логического выхода?

И транзистор и триггер сидят на одном напряжении питания: VDD_STM_3.3V. Обратите внимание на аналогичные соседние транзисторы для синего и зелёного светодиодов. Они также управляются от цифровых 3.3V-выходов STM микроконтроллера через 4,7К ограничительные резисторы и включены верно. А для «красного» транзистора, сидящего на том же напряжении и управляемого теми же логическими уровнями, сделано исключение.

Благодаря точно подобранному стабилитрону, как вы заметили, если понизить питание, допустим, на 0.3-0.5V, то ни контроллер ни все остальные схемы этого и не заметят, но ток на базу транзистора не пойдёт, и он не откроется, светодиод не загорится. Аля-Оп!

Поэтому там и стоит биполярник, а не полевик (например, такой же как рядом на схеме). Биполярник открывается от тока в базе, с полевиком такой фокус не прошёл бы.

Скорее всего эти 3.3V формирует управляемый преобразователь. Тонко менять из микроконтроллера его выходное напряжение — плёвое дело.

Кстати, ещё кое что: видите у p-полевика, запитывающего микрофоны подтягивающий «верхний» резистор (к стоку, D)? Когда вы не хотите, чтобы плавающий в воздухе затвор, в нормальном состоянии управляемый логическим уровнем, мог открыть полевик, то притягиваете затвор только к истоку (S). На схеме же устроен делитель. Очень интересно. Картинка низкого качества (специально), но там похоже оба резистора по 10К. Этот полевик будет открыт при выключенном триггере.
ни контроллер ни все остальные схемы этого и не заметят, но ток на базу транзистора не пойдёт, и он не откроется, светодиод не загорится

Коллега, всё может быть гораздо проще — нам вполне могли предоставить одну схему, а в железе реализовать совсем другую.

Серьезно? И никто не может разобрать Станцию и проверить?
> И никто не может разобрать Станцию и проверить?

Я не могу, у меня нет рентгеновского аппарата для просвечивания многослойных плат. А у Вас есть?
а в железе реализовать совсем другую

Зачем другую? И эта схема позволяет манипулировать светодиодом и триггером.
Спасибо за пояснения.
Скажите, а если при отключенном микрофоне колонка перезагрузится, микрофон останется отключенным? Например свет в кваритире отключат и т.д.
Справедливости ради Яндекс.Деньги — это отдельное юрлицо, но факт остается фактом: если попросит не ФТС (суд в интересах ФТС), а другая трехбуквенная организация, то Яндекс вряд ли сможет их послать.
Могут дополнить или переинтерпретировать закон против террористов и настойчиво попросить ключи шифрования от этой колонки (колонка же что-то отсылает на сервер? наверняка распознанный текст). Дальнейшего участия Яндекса в последующих событиях и не нужно будет.

Правда, всё это на правах шутки, потому что малейшая утечка таких данных и даже слухи серьезно бы дискредитировали это устройство. Т.к. эта колонка под контролем сторонних лиц намного больше подходит под определение «жучок», чем ТГ, к ней намного более подозрительное отношения у людей, плюс реалии РФ с её активно применяемыми 148 и 282 похоронили бы и бизнес, и возможность что-то подслушать.
Можете на несколько простых вопросов ответить прямо, ведь скрывать нечего.
1. Кнопка аппаратная, т.е. переключатель размыкает цепь физически? (Ответ «Нет» означает, что кнопка программная, посылает сигнал схеме разорвать питание.)
2. Как колонка (ПО) восстанавливаете состояние микрофонов после отключения питания? Где хранится состояние микрофонов?
3. Как визуально отображается состояние отключённых микрофонов?
Спасибо!
Кнопку невозможно программно испортить. Вот принципиальная блок-схема. А тут подробная схема с комментариями.

Когда микрофоны отключены, горит яркая красная подсветка у кнопки. Про восстановление вопроса не понял (зачем?).
А контакт «MUTE BUTTON» на GPIO заведён?
Нет. На gpio заведен контакт TLV_MIC_EN_DET.
При подаче питания оно наверное в неопределённом состоянии, процессор проверяет текущее через TLV_MIC_EN_DET и если нужно дёргает MUTE_BUTTON, чтобы переключить. Или я туплю?
Постоянная времени на /CLR пине триггера (сброс в 0) больше, чем на /PRE (установка в 1), поэтому при подаче питания за счет задержки зарядки конденсатора на CLR, состояние на выходе всегда будет 0, т.е. микрофоны будут включены (если еще учесть инверсию КПОМ выключателя).
А сигнал TLV_MIC_EN_DET повторяет выход состояния триггера (через повторитель) для передачи в gpio процессора — это нужно, чтобы процессор читал состояние, но не мог на него влиять.
Понятно, не заметил сразу.
Но разработчик схемы очень странно нарисовал сигнал MUTE_BUTTON, я бы прочитал схему так, что он где-то ещё к чему-то подключен…
я бы прочитал схему так, что он где-то ещё к чему-то подключен…
Я бы тоже. Не понятно тогда, для чего там резистор, если эта линия ведет в никуда.
То есть, передёрнув рубильник на входе в квартиру или дом, товарищ майор включит все Алисины микрофоны?
Кстати еще вопрос, нельзя ли подергать питание со стороны прошивки.
Ещё по даташиту на микрофон, рядом с ним должны стоять два конденсатора, я вижу один за транзистором, но имхо где-то на схеме есть ещё семь пар, микрофон потребляет мизерный ток, интересно, можно ли так часто переключать питание, чтобы светодиод светился, а заряда в конденсаторах хватало для работы микрофона.

Нажал кнопку.
Выключил микрофон.
Пропало электричество.
Появилось электричество.
В каком состоянии будет микрофон/кнопка?

Можно купить колонку и самостоятельно сделать такой переключатель, сплошные профиты — точно будете знать что Яндекс не передаст ваши разговоры товарищу майору, а с другой — вся полезность данного девайса.
Нет, там всё надежнее. Кнопку невозможно программно испортить. Вот принципиальная блок-схема. А тут подробная схема с комментариями.

image
Господа из Яндекса, а будет ли возможность стримить звук на колонку через какой нибудь AirPlay или через ваше ПО по Wi-Fi? Было бы очень клево иметь такую возможность :)
Можно по Bluetooth.
Ну BT не дает того качества звука :(
Да тут сама колонка на качество не претендует и близко, ну чисто физически…
… копирайтеры конечно постарались, пассивные излучатели конечно производят впечатление, но это по сути тот же фазоинвертор, просто масса объёма воздуха в трубе ФИ заменяется массой мембраны ПИ вот и вся песенка.
50 ватт говорите, а сколько эта штука от сети то потребляет?

Давайте будем честными, это типичная китайская платформа, которую прикрутили к сервисам яндекса…
По качеству воспроизводимого звука она может быть и лучше среднестатистического телевизора, но это не для прослушивания музыки, даже с яндекс музыки…
… хотя для поколения слушателей мобильных телефонов, может и сгодится
Очень спорная оценка. Над звуком мы основательно работали. Для нас это важное отличие от любых других устройств схожего сегмента.
А вы по спорьте, потребляемая мощность от сети какая?
Про достаточность громкости для шумной вечеринки, это не я написал :-)
А сам по себе усилитель, он электрическую мощность не генерирует, ему её надо из вне подвести…

Я охотно поверю что вы от души по шаманили с софтом (может быть), ачх эквалайзером разгладили, а может быть недостаток чувствительности компенсировали компрессией, и может быть даже многополосной, НО на фото абсолютно типичное китайское интернет радио, с типичными фишками и косяками…
И ЕМНИП у 18 allwinner-ра как и у старшенького в девките всё готово для работы с массивом микрофонов и более того, даже отладочный набор готовый было что бы это дело пощупать… Это типа фишка у allwinner такая вроде аппаратных кодеков.
А теперь вопрос, к каким именно чудесным алгоритмам упоминаемым в статье, приложили руку разработчики яндекса?
Да, память мне не изменяет вот оно!
А теперь ещё вопрос на засыпку, активирующее слово «Алиса» или «Яндекс» вы узнаёте сами?
Если на то пошло, то массив из 7 микрофонов для направленного снятия звука был ещё в Kinect в 2009, и это не они технологию разработали… и?
Да дело не в том кто и в каком году, а в том, что далёкие от технических и бизнес реалий райтеры, публикуя такие посты на техническом ресурсе, делают из Яндекса — Дениса Попова, а из вполне себе годной приколюхи BolgenOS…
Если бы это был какой-то очередной проект РосНано было бы понятно, но вот от Яндекса такой градус лжи несколько не обычен и иррационален…
… и я надеюсь, что эти мои комментарии кто-то прочтёт и сделает соответствующие выводы, организационные

Мне не надо объяснять что Яндекс не пустышка, я сам когда-то, и куча друзей, знакомых и даже родственников… И я даже знаю что Яндекс уже «не торт», и достаточно давно, но по любому не на столько, что бы придумывать себе лавры, при наличии вполне реальных…

Можно было честно написать что мы локализовали платформу и сделали прикольный ништяк для пользователей наших сервисов, а для разработчиков сделаем ещё больше ништяков чем заокеанские буржуины :-)
Но вместо этого, Яндекс сделал супер колонку нарушающую все законы физики, изобрёл кучу технологий о которых долго писать и конечно-же в этом деле ему помогали мировые эксперты (технологии которых и были лицензированны)…
Вы сейчас и меня оскорбили (и это вас не красит), и ошиблись в выводах своих. Нет, мы не локализовали никакую чужую платформу. Это наша платформа. Спроектированная в Яндексе. Отдельные алгоритмы работы со звуком (а не цельные компоненты) делали с помощью партнеров. Но в целом весь продукт и вся платформа спроектирована нами. Т.е. примерно так же, как и любое другое устройство от известных и больших компаний, создающих пользовательские устройства.

Ваша ссылка никакого отношения к нам не имеет.
Почему это не имеет, у вас там разве не R18, на фотографиях плат именно он :-)
Да, яндексу было-бы по силам сделать всё с нуля, даже без консультаций, но это было бы не на R18 ибо есть варианты дешевле и лучше, и было-бы действительно попадаловом на полный цикл разработки и производства.
А тут готовая платформа, и выбор продуктов на её основе, остаётся лишь найти то, что тебе подходит, допилить, оплатить и продать.
Так все делают, и это нормально.
Олимпус не скрывает что внутри панасоник, но есть и свои технологии и в софте и в конструктиве, за которые действительно не стыдно. Сони пробовали некоторые рыночные ниши, вообще брэндуя чужие продукты, при том что сами с усами…

Представление о том, что известные компании сами делают свои продукты, они далеки от реальности. Компаний способных на полный цикл в реальности не так уж много, и даже они редко прыгают в воду с головой. Ибо способность сделать либо, вовсе не означает необходимость это делать. Бизнес диктует свою логику поведения…
Процессор != платформа. Это я и пытаюсь вам объяснить. Мы сами спроектировали электронику из доступных компонентов.

Это даже близко нельзя обозвать «локализовали платформу», потому что платформа спроектирована нами.
Вы это можете обывателям так объяснять, а я немножечко так, сам разработчик, даже дипломный свой проект умудрился продать одной японской корпорации, ну и тех пор понеслось…

… так вот R18 больше чем просто ядро Cortex-A53 с базовым набором периферии, это SoC с графическим ускорителем, сигнальным процессором, аппаратным кодеком итд.
И продаётся он не только с документацией, но и с богатым набором схем, софта, и примеров готовых решений, что бы на их основе можно было делать свой продукт быстрее, с меньшими расходами и рисками…

… но это ещё не всё, у производителей таких платформ, есть партнёрские дизайнхаусы, а они бывают как сферические в ваккуме так и при крупных и крутых производствах…
Они получают платформу и документацию несколько раньше, чем она анонсируется публично, и готовят продукты на её основе. И продукты эти продаются брэндам, эксклюзивно или не очень. Обычно бывает так, и что-то мне подсказывает что этот случай не исключение.
Как я уже писал выше, это не связанно на прямую с интеллектуальным и\или технологическим потенциалом компании… (хрестоматийный пример, камеры сони на процессорах «ренегатов из сони-же», разработаны и произведены в китае, талантливой командой, хорошего завода. И лишь спустя несколько лет они делают свой чип и рвут амбу по качеству, но никак не по доле рынка)

PS. Да, я тоже люблю критичные места разводить «в ручную», и переделывать схемотехнику когда в этом есть смысл, и не я один, это прямо национальная черта, какая-то… Но, если я собрал машинку из лего, я собрал машинку, а не реализовал инновационную технологию дистанционного управления по средством невидимых глазу лучей, я её не реализовал, а только использовал…
Ваш длинный комментарий примерно никак не опровергает мои слова. Платформа тут одна – и она наша: io.yandex.com
Конечно не опровергает, только подтверждает…
… есть производители SOC для IP камер, есть производители модулей с этим SOC, а есть производители камер, которые покупают модули с этим SOC и поднимают свои web сервисы для отдельных заказчиков которые это дело продают под своими брэндами…
А иногда, брэнд уже имеет и продаёт свой сервис видеонаблюдения, и заказывает камеры с брэндовой прошивкой и корпусом, как Ростелеком\МТС…
… вот и с Яндексом та-же песня, это нормально, но раз уж вы пишите про кучу крутых технологий от Яндекса, я бы охотно в это поверил, если бы не знал под каким соусом и с какими специями в комплекте продают R18, а знал я об этом за долго до, так что сейчас с трудом припоминаю.
Отсюда и мой, казалось бы совсем простой вопрос о том, что именно Яндекс переделал, а что оставил как есть.
Ведь тот же вопрос активации голосом, Яндексом уже был решен для мобильных устройств могли бы и тут, работа с массивом микрофонов тоже вполне посильная задача.
Но вы отмалчиваетесь и сливаете карму, и напрасно…
Ибо желающих притащить мне образцы для изучения и написать обрзор по мотивам, появилось некоторое количество, а я того и гляди соглашусь, хотя мне вроде бы не до того, а хвалёный вами звук утопит любой честный обзорщик ибо чудес небывает…
… карма она такая :-)
В каком смысле сами? Это наш SpeechKit, наши технологии в машинном обучении.
Ну, просто для активации, там так-же есть встроенная плюшка от третьей стороны, вот и мне интересно её-ли использовали или всё таки SpeechKit имеющий аналогичный функционал…

Заокеанские товарищи использовали встроенную ничтоже сумняшеся ибо на то есть некоторые технические резоны, а вы значит утверждаете, что SpeechKit, и это действительно занятно… и легко проверяемо
Где там? Амазоновская платформа к нам никакого отношения не имеет.
А причём тут вообще амазон, я про голосовую активацию говорю, а куда уж потом отдавать записанный фрагмент, амазонкам-ли, яндексу или китайцам это дело десятое…
В демо наборе allwinner-а, для этой (и не только этой цели :-), были блобы от gmems. Условий использования не помню, но вроде амазон их тоже использует.
Приложили ко всем. Но не без помощи партнеров по некоторым направлениям. Например, мы не скрываем, что с улучшением качества звука нам помог Институт интегральных схем общества Фраунгофера.

Так у вас ведь и написано, что бОльшую часть времени колонка играет в моно режиме и только иногда переключается в "стерео"… со стереобазой в 10 см. Ой, это стерео для гномиков? А у меня голова в стереобазу не пролазит. Это правда не о прослушивании музыки.

Всё относительно :)
Думаю, SADKO имел ввиду, что этот класс акустики в принципе не может на вечеринку тянуть. У меня похожая колоночка в ванне стоит, для подкастов сойдет. Для музыки и фильмов совсем другая система с ресивером, суммарной мощностью 700Вт и стоимостью далеко не $150.

В телевизорах сейчас и правда ставят акустику, похожую по размеру динамиков и объему.
Без поддержки HomeAssistant мне лично, такая колонка не нужна.
Не хочу вас обидеть, но звук у вашей колонки это самая слабая её сторона. Даже на фоне косяков с блютусом и кодеками. Я даже колыбельную ребенку не могу поставить, потому-что на малой громкости слышу как бухтит саб, но не слышу слов колыбельной. Ужасно. 2 из 10 за звук.
ВТ5 должен помочь, поидее, но у них че-то сильно старый выбран.
У них и кодек SBC. В наше то время.
Появится ли в Я.Музыке поддержка Google Сhromecast audio? Или будет ли подобное устройство от Я? Лично меня только это держит на подписке у гугл.мьюзик.
Задавал их саппорту этот вопрос, про chromecast. Сказали что возможно, когда-нибудь, может быть…
Какие кодеки передачи звука по BT поддерживает?
Поддерживаю вопрос. Яндекс разорились на AptX?
А чем он лучше AAC кроме маркетинга?
Такая же проприетарщина, так что ничем не лучше, но и не хуже. Лично мне, из-за имеющегося парка девайсов с поддержкой AptX, он интереснее.
Сейчас колонка поддерживает стандартный AD2P.
A2DP это не кодек.
Вероятно, надо читать как SBC
Ох, у меня лично сейчас вероятность покупки снизилась в три раза.
Только SBC. Звук у неё и так не очень, а с этой древностью даже до китайских пищалок не дотягивает. К тому-же на моем SGN9 больше пары минут соединение не держалось, рвется.
SBC не так плох, больше проблем в настройках «по умолчанию» в угоду совместимости: 4pda.ru/forum/index.php?showtopic=914135
Пессимист ON:
Сомнительно что выстрелит. Цена загнута по сравнению с Google Home Mini.
Постоянные предложения от 40€ Недавно было 2 штуки сразу и получилось по 16€
Хотя мини и не конкурент по функционалу, для поиграться самое то.
А самое главное создается инфраструктура вокруг. Управление дополнительным оборудование.
Будет ли вариант мини — в разы дешевле?
А для умного дома так никаких подвижек и нет?
Приватные диалоги?
А в идеале ключевые слова. Хочется говорить «Алиса, включи свет в коридоре», «Алиса, выключи телевизор». А не «Алиса, скажи {моему умному дому}, выключить телевизор».
Поддерживаю. Было бы неплохо предоставить возможность давать имена командам. Например, «Алиса, доброе утро!» и у тебя включает свет и кофе-машина. Понятно, что нужно навыки писать, но идея именно в том, чтобы не было слов-посредников.
в google home такое уже давно есть
С помощью Дуси ( play.google.com/store/apps/details?id=com.dusiassistant&hl=ru ) и такого модуля ( www.kernelchip.ru/Laurent.php ) включал-выключал свет, диммировал, громкость менял и т.д. голосом, можно было сказать допустим, Дуся у нас гости — она включит чайник. Т.е. на любую фразу можно практически любое действие запрограммировать. Навыки программирования не нужны, все предельно просто.
Присоединяюсь к вопросу. Какой-нибудь выход на другое оборудование по речевым командам иметь совсем не помешает.

Нужна интеграция с распространенными серверами умного дома — MajorDomo, OpenHab, HomeAssistant. Но имхуется мне, если платформа будет открытой, пользователи указанных серверов быстро сами забабахают поддержку.

Да, но есть два момента.
1. Разработчик этого навыка будет получать все мои события. Я хоть и не параноик, но это слишком. Создать свой навык с заковыристым названием сейчас какой-то выход, да. Но вопрос, пройдёт ли модерацию, да и не нужны мне запросы от других людей.
2. С лишними фразами «Запусти волшебные заклинания» это всё-таки нежизнеспособно скорее всего.

А что внутри программно?


Оно умеет играть Netflix?

Будет API? Чтобы на Raspberry запустить. Судя по техническим характеристикам устройства — это посильная задача.
тоже первая мысль была после просмотра ттх =)
НЛО прилетело и опубликовало эту надпись здесь
Еще бы туда Plex и Netflix поставить, было бы совсем шикарно
Сколько раз пытался пользоваться плексом так и не понял смысла. Нормально ничего не работало :( Может не там запускал, конечно.
С Plex'ом всё просто. Есть сервер, туда вы складываете фильмы, сериалы, музыку, фотографии. И есть клиенты, телевизор со смарт-тв, apple-tv с проектором и прочие планшеты с телефонами, которые этот контент потребляют по локальной (и не только) сети.
Plex помнит где вы остановились в просмотре, позволяет выбрать дорожку звука, субтитров и т. д.
НЛО прилетело и опубликовало эту надпись здесь
Ничто ничему не мешает. Складывайте и смотрите.
Может быть расскажете про плеер под apple tv 3, который с самбы будет тянуть файлы? Да и под смарт-тв тоже интересно. Позицию тоже удобно в плеере запоминать, начал смотреть на ТВ, продолжил на планшете/проекторе – ищешь заново. Про обложки, видимо, даже упоминать не стоит.
infuse показывающий фильмы по самбе хранит метаданные в icloud — в том числе и обложки и позиции просмотра, получается вполне удобно и красиво.

>>Может быть расскажете про плеер под apple tv 3, который с самбы будет тянуть файлы?
Замечу что не на все дисковые станции ставится plex server, так что оба способа имеют право на жизнь — и plex server и dlna по самбе.
infuse не работает под apple tv 3, насколько я понимаю. dlna – да, прекрасно, кто спорит (но выше говорили про самбу, dlna не упоминался). plex, кстати выступает и как dlna сервер тоже.
самое главное удобство в использовании чего-то одного на всех устройствах (вплоть до проигрывания в браузере, кстати). да, не на всех хранилищах Plex Server работает, но у меня всё равно компьютер включен 24х7.
Для DLNA, на мой взгляд, Plex — это оверкилл. Вполне хватает miniDLNA.
При этом, позицию может запоминать и сам плеер
На одной конкретной машине это так. Но по описанию мне показалось, что Plex позволяет начать смотреть фильм в зале, а затем продолжить его смотреть в спальне сразу с того же места. Как это самбой сделать без плясок с бубном? DLNA, например, поддерживает передачу подобной информации?
Серьёзно? Самба сама скачает постеры, оформление, заглавную музыку, описание каждой серии, оценку, подставит красивый и удобный UI для выбора, сам сгруппирует просто десятки лежащих в одной папке файлов по сериалам и сезонам, запомнит место окончания воспроизведения и позволит потом в метро продолжить смотреть с того самого места, где вчера остановился при просмотре на телевизоре?
Plex универсален (работает почти на всех платформах), создает удобную медиатеку и запоминает какие файлы уже просмотрены (удобно при просмотре сериалов), поддерживает так же создание музыкальной библиотеки и удаленный ее стриминг, если вы не за натом (собственный аналог Яндекс.Музыки, например) и все это настраивается в два клика, а не как самба.
создает удобную медиатеку

Вот этим не знаю кто занимается. Скачал недавно фильм — 70Гб в 4k. Один сезон сериала тоже под 100ГБ занимает, а диск не резиновый. Так что посмотрел — удалил.
Было бы круто, если бы была возможность заливать прямо на колонку свои скрипты с возможностью публиковать обращаться к эндпоинтам и взаимодействовать сущностными в них голосом, хотя есть диалоги, но хотелось бы взаимодействия в пределах локальной сети

Вопрос насчет распознавания ключевого слова — если у меня несколько членов семьи, включая детей — требуется ля обучать колонку на каждого из них?

Будет ли станция официально продаваться и поддерживаться за пределами РФ? Например в Казахстане?
Яндекс Музыка в Казахстане работает.
ОК, а если пойти чуть дальше за пределы — например в Евросоюз?
В Нидерландах не работает. Подозреваю, работает только странах ЕАЭС (и то, не факт, что во всех).
Работает, что музыка, что радио — но только при активной платной подписке.
Я жмот, слушаю в 128 кбит/с (да и туговатый на уши). А при таких раскладах оно в Нидерландах не воспроизводится.
Это все конечно здорово, но было бы интересно увидеть в статье реализацию упомянутых алгоритмов. Не исходный код, разумеется, а описание логики на псевдо языке.
Да, каждый из них на отдельный пост тянет.
В ФСБ наверное, уже потирают потные ладошки.))
Скажите, а кому именно это устройство помогает в повседневных делах? Пользователю, заплатившему за устройство, или компании, владеющей рутовым доступом к этому устройству?

После недавнего факапа Амазона я не понимаю каким раззявой надо быть, чтобы ставить чужое шпионское оборудование за свой счёт в свой собственный дом.
Ты еще забыл спросить подвержен ли установленный в колонке проц твоим любимым уязвимостям.

Я рад, что ты помнишь, какие у меня уязвимости любимые. Я огорчён, что ты помнишь их неправильно.

Вот только не надо слез.
Так не плачь. Я же не заставляю.
Чем это отличается от телефона в вашем кармане?

fdroid'ом и рутовым доступом для меня?

И к интернету телефон не подключаешь.
Подключаю.

Структура доверия на андроидах ужасная, я согласен, но указывать на него, как моральное обоснование делать так же — всё равно, что пристраиваться в очередь на изнасилование.
Аналогия в том, что вокруг вас уже полно устройств с микрофонами и доступом в сеть. И никаких проблем это вам не приносит. Нет оснований считать, что ещё одно устройство может хоть как-то навредить.
НЛО прилетело и опубликовало эту надпись здесь
И никаких видимых проблем это вам пока не приносит.

FTFY

Не у всех производителей таких устройств есть действующие обязательства (по законодательству) по раскрытию информации перед спецслужбами именно этой страны.
Ещё раз повторюсь. Станция ничего не записывает в фоне и никуда это не отправляет. И нет никаких обязательств это делать. Пожалуйста, давайте смотреть на факты, а не абстрактные страхи.
НЛО прилетело и опубликовало эту надпись здесь
Это опять же абстрактный пример для несущестующего решения по несуществующему закону.

Станция не записывает фоновую речь и никуда это не отправляет. И технологически не может быть иначе.

Кстати, любая активность Станции визуализируется. Она незаметно ничего не делает.
Ага, а на fdroid каждая новая версия каждого приложения аудит безопасности проходит и ты каждый раз внимательно с отчетами по этим аудитам знакомишься. Для меня рут — отличная вещь, но не для паранойи, а для лучшего контроля за устройством. Например, избирательно оставить интернет лишь конкретным приложениям, блокируя в том числе системные, в заграничной поездке — бесценно.
Возвращаясь к вопросу безопасности, то рут — не спасение. Хочешь приватности — езжай в тайгу, такова правда 21 века. Хочешь приватности и технологий — научись жить в режиме, будто за тобой всегда подглядывают, нифига в этом сложного нет.
У меня на домашней машине — debian. Я ставлю софт из системных репозиториев ни разу не сомневаясь в намерениях авторов (творить добро). Благодаря системе мейнтейнеров, каталоги софта дебиан сейчас — самые доверенные из всего, что я вижу вокруг. Ни одна из программ в этом каталоге (ветка /free) не шпионит за пользователем, не пытается сделать из пользователей pig data, не показывает рекламу и т.д.

Я согласен, что ситуация с ПО для сотовых телефонов ужасна. Однако, это не повод во всех других случаях ориентироваться на худшее. Давайте ориентироваться на лучшее?
Хочешь приватности и технологий — научись жить в режиме, будто за тобой всегда подглядывают, нифига в этом сложного нет.

Это как: не занимайся сексом\мастурбацией, не делай ничего, что может быть сочтено противозаконным (в нашем случае это очень широкий спектр: от критики власти до скачивания пиратской мп3шки), не веди разговоров о личных вещах (вообще ни о каких и никогда) и так далее? Вам не кажется, что ну ее нахрен такую жизнь?
Это как: не занимайся сексом\мастурбацией
Наоборот занимайтесь больше. Если за вами всегда одинаково наблюдают, то какая разница, где это делать?))
Это уже компромат в текущей системе ценностей и его можно будет использовать против вас в будущем. При таком раскладе в будущем компромата не будет только на праведников, параноиков и отшельников, вот они то и станут новой элитой, как правящей, так и бизнес, будет весело.
«Праведность» может стать компроматом в будущей системе ценностей.
Не станет, людские ценности хоть и меняются, но вектор всегда одинаковый. Например, проституция осуждалась и с ней боролись всегда: начиная от побивания камнями 2000 лет назад (кое-где и сейчас практикуется) заканчивая дегуманизацией в сегодняшней прогрессивной Швеции (хотя подается это вообще со знаком защиты).
Наличие условно вечных вещей не противоречит существованию изменчивых. Мы же понимаем, что секс это просто очевидный пример.
Если в месте твоего проживания могут начать осуждать за что угодно, то да — нафиг такую жизнь. Я исхожу из того, что все таки есть какое-то постоянство этических и законных норм. Так, сепаратизм и силовые акции по смене власти, например, нигде не приветствуется, по крайней мере властями того региона в отношении которого это обсуждается — ну так не пеняй, что тебя повязали за обсуждение организации революции, пусть это и проводилось в своем кругу.
что может быть сочтено противозаконным
Если есть законы, запрещающие какие-то действия, а ты с ними не согласен, твой единственный путь — выйти из зоны их юрисдикции, будь то отмена закона или твой переезд. Игнорировать закон под предлогом того, что он плохой — это нифига не выход. Скажи, кража перестанет быть кражей, если вора не поймали? Ведь именно так ты сейчас рассуждаешь — знать, что за что-то тебя накажут, но продолжать делать, надеясь на то, что не обнаружат.
Если же исходить из того, что действия станут незаконными постфактум, то тут выхода нет вообще никакого, к сожалению.
НЛО прилетело и опубликовало эту надпись здесь
являться прекрасным инструментом для потенциального шантажа
И? Не хочешь шантажа — изначально не допускай возможности его возникновения. В твоем примере в случае секса с сестрой риск появляется уже от твоей же сестры, вдруг она решит тебя шантажировать? Ты можешь что-то предложить кроме как не спать с ней, раз опасаешься за карьеру?
НЛО прилетело и опубликовало эту надпись здесь
Скажем так: в странах свободных можно критиковать власть сколько тебе влезет, сажать за это тебя не будут (если будешь очень сильно мешать, то постараются избавиться другими методами), у нас можно присесть за случайный лайк не той записи, например, по сути это уже «все подряд». Причем напрямую закона запрещающего лайкать именно вот это нет, поэтому если ты не лайкаешь только котиков или хвалебные оды режиму, то ты всегда в зоне риска. И постфактум это тоже работает (были случаи когда прилетало за запись, опубликованную пару лет назад по новопринятому закону).

Но покуда есть какая-никакая анонимность, пусть и очень базовая и мнимая, бегать за каждым никому не нужно (поэтому в основном такие вещи происходят в сетях, принадлежащих мейлру, так проще доказуху собирать). Убери анонимность и можно пару городов обнести колючей проволокой, устроить там гулаг и массово туда депортировать, у нас уже такое было в истории страны.

Да и как заметили выше: есть вещи, которые законом не наказуемы, но проблем могут добавить. Это может быть и не только инцест, который комментатор выше привел в пример, но и даже просмотр какого-нибудь непопулярного фильма в определенных кругах.
Согласен. Если такие устройства и ставить то только с открытой прошивкой.
Только прошивки тут не достаточно. Нужно, чтобы голос не покидал устройства. Идея «шлите нам звук на сервер» плоха тем, что что именно сервер делает со звуком никто не знает. Вот если устройство всё обрабатывает локально, а на сервер идут конкретные rest-запросы (дай погоду), или даже не идут (позвони туда-то), то тогда эта система более похожа на действующую в интересах пользователя.
Такое нельзя реализовать на текущем уровне технологий. Нормальное распознавание локально ещё не работает. Ни у кого, кто пытается сделать устройство с far-field распознаванием.

Но я всё равно не понимаю, чем отправка голосовой команды для управления сервисом отличается от отправки кликов и жестов с аналогичной командой.
Скажите, в чём разница между отправкой на сервер кликов мышки и отправки на сервер всех движений пользователя?

Если на сервер уходит голосовой фид, то он уходит целиком (даже если и ограниченный окном «после кейворда»). На сервер уходит не семантика команды, а окружающие звуки, ультразвуковые маячки в рекламе и т.д.

Вот, например, что мешает запустить яндексу сервис оценки просмотра ТВ рекламы? Или, собирать статистику о том, что смотрят пользователи по звуковому треку того, что они смотрят?

А как насчёт определения есть в семье маленький ребёнок или нет? А медицинские факторы (кашляет, сипит — можно рекламировать лекарства), интимные (голоса людей в ночное/вечернее время), etc?

Я с трудом себе представляю клик на веб-странице, который отгружает с собой такую кучу информации.
Чтобы это работало так, как описали вы, в облако надо отправлять весь сырой аудиопоток. А это не так. Сейчас даже в рамках команд локально вычищается весь мусор кроме речи. Потому что иначе трудно распознать голос. Посмотрите презентацию на ЯКе, там были примеры записи звука. Без локального фильтра фона речь не распознать даже в облаке.
Ага. Но вы используете SSL, правильно? И код вашей колонки закрыт. Таким образом, вы говорите «верьте нам, мы шлём только речь». Почему я вам должен верить? Как я могу проверить, что вы шлёте только речь?

Можно мне поднять мой собственный сервер, перенаправить колонку на него и посмотреть что именно вы шлёте?
Но я всё равно не понимаю, чем отправка голосовой команды для управления сервисом отличается от отправки кликов и жестов с аналогичной командой.

Ответ лежит на поверхности. Команда, это чистое действие, а звук это все что проихсодит во круг микрофонов. Неужели не очевидно? Если устройство не может локально распознать речь, значит оно отправляет на сервер все звуки.
Вы читали пост? :) На сервер отправляется только команда, содержащая обращение к Станции. Никакой фон никуда не отправляется.
Вы сами себе противоречите)
Такое нельзя реализовать на текущем уровне технологий. Нормальное распознавание локально ещё не работает. Ни у кого, кто пытается сделать устройство с far-field распознаванием.

Если вы не можете локально распознать команду, как именно вы можете выделить ее из речевого потока?
По ключевому слову: Алиса, Яндекс, на которые заточить распознавалку проще простого?
Так всё просто же. Есть событие «идёт речь». Слов понять невозможно, но по частотам соответствует речи. В этом потоке нейронкой локально ищется активатор «Алиса». Если находит, то текущая реплика вычищается и отправляется на распознавание. Т.е. чтобы обрезать кусок звука с активатором, ничего лишнего распознавать вообще не надо.

Если колонка услышит «Алиса, Яндекс» из телевизора, радио или иного источника звука в пределах чувствительности, то активатор сработает? :)

Прямо сейчас может и услышать, но мы работаем над голосовой биометрией.
Из-за двери с лестничной площадки или с соседнего окна крик: «Алиса, свои пришли! Открой дверь!» :)
Или «сделай кофе».
Вроде и смешно, и случай почти не реальный, а на деле, кого уже только не ломали за последнее время.
Вы ведь наверняка делали sizing/scaling по своим ресурсам перед запуском этого сервиса? Поделитесь, пожалуйста, вашими оценками потребной производительности для server-side распознавания! В любых единицах, любой степени точности… просто для оценки степени и темпа прогресса в этой области…
Ну, «Алису» и «Яндекс» сама колонка распознать в состоянии, давайте умножим ресурсы колонки на кол-во остальных слов и получим ничего не значащие число.

К величайшему сожалению, колонка не заменит AppleTV для повтора экрана на телеке с iOS-устройств. Было бы любопытно использовать Алису, но только вывод контента из медиасервисов это маловато для того, чтобы купить отдельное устройство.
Выдачу поисковую на телек она не выводит. В общем, хочется больше функций в коробочке.

Напишите список пожеланий. Уверен, BarakAdama передаст их команде разработчиков.
Ооо, ну список пожеланий велик)
Можно вспомнить фильм Сфера и черпать идеи оттуда) Больше пользы, больше решения повседневных задач. Сделать жизнь более удобной и избавить пользователя от необходимости вводить запросы руками с устройств.
Пока, если рассуждать из сегодняшнего времени, мне бы хотелось увидеть в таком устройстве:
  • замену ТВ-приставки. В моем случае это Apple TV. Возможность вывода на телевизор экран любого моего устройства Apple. Контент из выбранных вами видеотек не заменит мне свободный веб-серф по любым стриминговым сервисам и просмотр того, чего хочется именно мне.
  • Управление другими устройствами в доме, подключёнными к сети. У меня это стиралка
  • Персональный ассистент. Ведение календаря, навигация для перемещения между встречами. Управление голосом, конечно же)
  • Покупки. Поиск, покупка еды, товаров, сервисов, билетов в кино, на мероприятия. Тут же добавление записей в Календарь. Рекомендации мне попутчиков из моих знакомых, если они тоже идут на мероприятие
  • Сервис рекомендаций. Мероприятия для профессионалов, подборки книг, статей, видео. Чтение аудиокнижек
  • Проектор для дополненной реальности в фильмах и играх, погружение в происходящее
  • Решение любых повседневных задач, которые мы обычно выполняем дома

А устройства от яблок не умеют сами себя выводить на ТВ?

Насколько мне известно — нет(
через провод умеют
Алиса, вызови мне такси на работу / до такого-то адреса.

Вопрос немного в сторону: и всё же требует ли колонка постоянного подключения к розетке или её можно легко транспортировать из комнаты, в комнату благодаря аккумуляторам? В статье упоминается этот момент лишь вскользь.

Требует. Но это не мешает выключить её, перенести, включить заново.

Проблема в том, что музыка закончится :) и на пляж не возьмёшь музыку послушать. (но, аккумуляторы это удорожание колонки и звук такой мощности все равно бы батарею выжиралдовольно быстро)

У меня вот какой вопрос: я долгое время считал, что Яндекс повторяет свои сервисы за Гуглом. был удивлен, когда обнаружил, что во многих случаях Я был пионером, просто с меньшим пиаром запускал сервисы.

Так вот вопрос: колонка эта начала разрабатываться раньше, чем аналогичные устройства от гугла, эпл, амазона?

Это не троллинг. Просто хочется знать своих героев.
Ну и вообще, электроника и акустика разрабатывались сотрудниками яндекса или это аутсорс + референс дизайн?
Станция спроектирована командой Яндекса, но также мы привлекали международных экспертов в определенных областях. Например, технологию улучшения звука помогал делать Институт интегральных схем общества Фраунгофера, который в своё время изобрел формат MP3. Также в процессе разработки к Яндексу присоединились инженеры подразделения Cubic Robotics, имевшие уже на тот момент большой опыт в разработке железа для «умного дома».
Спасибо, интересные подробности!
4K HDR поддерживаются? Киношечки с Амедиатеки смотреть.
Пока нет.
Вы завезёте поддержку софтверным обновлением или ждать вторую версию колонки?
По железу колонка как raspberry pi, а та 4к не тянет, так что только новая колонка с более мощным железом (стандарт HDMI 1.4 к слову подразумевает 1080p 24Гц)
вики говорит, что 1.4 поддерживает 4к при указанной частоте кадров.
Подтверждаю, мои знания оказались не правильными. Но кортекс на 1ггц все равно едва ли 4к потянет.
Если господам из Яндекса Allwinner дал нормальные дрова — на аппаратном ускорении уедет. В конце концов, 1080p в x264 8-bit вполне утаскивается Allwinner H3 (Cortex-A7, Mali 400 MP2) при условии наличия проприетарных дров для ускорителя.

Другое дело, что там именно что блоб, а не модуль ядра, и в открытом доступе есть только дико нафталиновая версия, которую в Linux (в данном случае, под Armbian и компанию) бэкпортили из имиджа Android для Orange Pi PC.
Окей, микрофоны вы вырубатете по питанию. А вы же конечно помните, что звук можно снять и с динамиков, которых там целых три. Пусть хуже гораздо, но для шпионажа достадочно.

"Шпионский софт незаметно превращает наушники в микрофон"
habr.com/post/399363
Ну, динамики там за усилителями, цифровыми…
… это не наушники воткнутые в AC97 где выход можно назначить входом итд
Это еще нужно отреверсить, чтобы точно быть в это уверенным.
Не припомню что-бы нужно было что-либо реверсить, всё делалось описанными штатными методами. По умолчанию драйвер сам пасёт состояния входов\выходов, но это не обязательно, всё можно контролировать в ручную программно…
… попробуйте установить родной драйвер, воткнуть наушники и назначить на этот выход, линейный вход, а потом с него писать, вот и всё
У вас шапочка из фольги сползла.
НЛО прилетело и опубликовало эту надпись здесь
Может ФСБ держит его в заложниках и он так маякует, что они заставляют его делать закладки в React OS?
Будет ли поддержка UHD?
Мы выбрали ARM Cortex-A53 не только из-за тяжелой задачи воспроизведения потокового видео

Если там есть аппаратный декодер, то воспроизведение не сложнее отправки байтового потока на девайс. А если его там нет, то возникают вопросы.
Если бы было только видео, то да. Но нужно и видео запускать, и параллельно голосовое распознавание на большой дистанции поддерживать.
Надеюсь, скоро выпустят версию мини. Не всем нужен качественный звук.
BarakAdama интересно а почему в колонке используется Bluetooth версии 4.1? Ведь на дворе 2018 год и 5 версию уже много где ставят. Это было сделано что бы удешевить не много? Или есть другие моменты?
Тогда разработчики мало что смогут улучшить во второй версии же…
НЛО прилетело и опубликовало эту надпись здесь
Ну, это они зря. Кодек SBC плюс разрывы связи = фейл
Хотелось бы всё-таки больше подробностей про программную начинку. Там Android или что-то проприетарное? Если есть возможность устанавливать APK, то как медиаплеер устройство имеет смысл. Как просто умная колонка — не очень интересно.
А в ней есть USB разъемы? Воткнуть свою флешку с музыкой/видео например
BarakAdama, а у вас там никто Home-Assistant не использует? Надеюсь что будет модуль у HA для вашей колонки
Напоминает события фильма «Она» 2013 года.
Интересно протестировать колонку при просмотре фильма «Гостья из будущего»…
«Алиса! Алиса, я им ничего не сказал!»

Сможет ли колонка играть видео с сетевой шары? или с DLNA?

Подскажите пожалуйста,
* 50..20000 Гц — это при нелинейности АЧХ ± 3дБ?
* Какая частота раздела кроссовера?
Сейчас частота раздела 2 кГц.
Наше устройство должно справляться с аудиодорожкой лучше, чем динамики типичного телевизора (это касается как глубоких басов, так и общей мощности).

А можно использовать Станцию как внешнюю колонку с подключением через HDMI? (например, к ТВ)?
3.5 разъема, я так понимаю, нет?
Ну во-первых. Дорого.
Во-вторых. Я таки не вижу зачем мне колонка, пусть и «умная».
Вариант раздавать бесплатно, продавать подписку вы не рассматривали?
Конкуренты так не делают (хоть и продают, вероятно, с дисконтом).
Что будет если не продлевать подписку на музыку/видео?
Будет играть только бесплатный контент или ничего?
Дорогой яндекс. подздравляю с устройством. сразу к вопросам

1. don't be evil. смогу ли я поставить туда алексу, картану и прочих девиц конкурентов? сейчас уже наверно кажется странным это предложение, а в 2015 было ок (https://habr.com/post/250887/)
2. что там с опенсорсом? вы там явно не baremetal все гоняете. отчасти это продолжение первого вопроса.
3. почему не поддержали отечественных разработчиков. есть ведь и байкал и элвисы с дсп.
1. У нас есть платформа Диалоги. Теоретически разработчики сторонних помощников могут сделать свой навык.
2. Это может нарушить ряд лицензионных прав. Мы ведь работали над устройством вместе с партнерами.
3. Мы выбирали оптимальные решения с точки зрения цены, производительности, возможностей, поддержки прочих компонентов.
есть подозрение что вы используете в вашей платформе исходный код проектов распространяемых на открытых лицензиях. подозреваю, что к ним относится загрузчик, ядро ОС и некоторые компоненты окружения. собственно вопрос, планируете ли вы выкладывать исходный код в соответствии с этими лицензиями, как это делает например Sony [1], Amazon [2] и другие. Лицензионные права проприетарной части меня лично не интересуют.

1. developer.sony.com/develop/xperia-open-source-archives
2. www.amazon.com/gp/help/customer/display.html?nodeId=200203720
Супер, после выхода посмотрю обзоры.
Если она сможет проигрывать кино из бесплатных источников или хотя бы youtube, то думаю куплю такую.
Хотелось бы побольше узнать про конкретные сценарии использования данного устройства и User experience. Ну например, как решается такая банальная задача как повышение громкости устройства до определенного уровня, если устройство стоит под телевизором, а я сижу на диване в противоположном конце комнаты?
Мне нужно будет много раз говорить «Алиса! Сделай погромче!» до тех пор, пока звук не достигнет нужного мне уровня (или пока колонка не перестанет меня слышать)?
Не проще ли решать такие задачи с помощью пульта (которого, как я понимаю, нет в комплекте)?
Можно конкретный уровень громкости назвать :)
Используют дома google home, поэтому возникло несколько вопросов:
— стримить ауидо можно будет только по bluetooth? может быть chromecast (airplay)? ;)
— планируется ли мини версия колонки, чтобы, например, поставить на кухню
— можно ли несколько устройств объединять в группы, чтобы воспроизводить музыку одновременно в нескольких комнатах? как сейчас умеет google home
— будет ли публичное api для работы с колонкой в локальной сети, чтобы управлять через системы умного дома? например, воспроизвести какое-либо сообщение/уведомление
Мы думаем в сторону умного дома, пока конкретно лучше не буду ничего обещать :) По остальным пунктам: возможности Станции будут расширяться, но что именно и когда появится пока рано говорить.

С яндекс.директом интегрирована? К СОРМ подключена?

В Украине будете продавать или только контрабандой через vpn?

Некоторое время назад Яндекс запустил Яндекс.Кит — проект ОС для телефонов, почти как у Гугла, но только внутри все от Яндекса. Проект протянул что-то вроде года, и тихо сдулся, оставив «счастливчиков» купивших устройства на нём, с немым вопросом «что же мне с этой трубкой делать?»

До сих пор интересно, почему забросили — не проект, а пользователей?
В каком смысле? Обновления выпускали, Стор так до сих пор работает.
Расскажите подробнее как Beamforming реализовали? Своими силами? Он постоянно сигнал с 7 микрофонов обрабатывает? Почему именно 7 микрофонов?
С этой частью нам помогал партнер – Институт интегральных схем общества Фраунгофера. Этот алгоритм – часть комплекта алгоритмов, которые работают в одной связке. Сначала мы определяем направление голоса и только потом с помощью Beamforming вычищаем все остальные шумы из сигнала.

Оптимальная конструкция для подобных задач – это один микрофон в центре и четное количество по кругу. Бывают варианты 4+1 (недостаточная точность для нас), 6+1 (как у нас), 8+1 (незначительно добавляет качество).
Спасибо, это прекрасно

Где встроенный z-wave ??
Или Homekit, если это вообще возможно?!

А можно будет самому удалённо подключаться к колонке и слушать, что вокруг происходит?
это уже радио няня?
Нет, это паранойя.
Такой возможности нет.
Как Алиса с планшета с колонкой напару хозяевам косточки перемывают?
Кранчролл и ваканим будут подключены? Или только всякие ivi и подобные?
У меня вопрос морального характера. Так понимаю что колонка начинает отправлять всё в эфир по слову «Алиса». Что делать если у меня дочь Алиса, мне перестать называть её по имени? Дальше представить страшно, как могут ее задразнить в школе одноклассники. Уважаемый Яндекс смените название своему сервису на не человеческое имя.
Мы на этот случай предусмотрели возможность отключения активации по слову «Алиса».
А может ли колонка играть музыку по HDMI на приличную аппаратуру, а сама только разговаривать?
Пока не думали над таким сценарием.
??? Что за сценарий.
Сейчас, когда колонка играет, она звук по HDMI отдаёт?
Технический вопрос. А это нормально, что у Вас заглавная картинка к этой статье весит 4.5 МБ?
Сам в шоке. Спасибо, уменьшил.

Ну дайте же, дайте http api, или какое то другое, но api! Все эти сферические Яндекс музыки и прочие ютубы это хорошо, но девайс с
качественным распознаванием речи — цены бы не было

Так есть же платформа Диалоги.

Нужен приватный API для интеграции с умным домом.

Вижу в девайсе один существенный недостаток — отсутствие Ethernet. Она же (Станция) может видео на телевизоре показывать, верно? И заявлена поддержка показа из локальной сети, верно? Wi-Fi это конечно хорошо, но практика показывает что даже с fullHD потоком Wi-Fi справляется крайне плохо. 4к же прогнать через Wi-Fi задача вообще не реальная. Т.е. может и реальная в каких-то лабараторных условиях, в условиях же квартиры, моя tv приставка через Wi-Fi лагает на каждом втором HD фильме.
Есть ещё куча вопросов по функциональности колонки и может девайс действительно выйдет интересным, но в таком виде кино через неё не посмотреть.
даже n вайфай в условиях квартирты сквозь стену отлично тянет fullHD.
ac тянет 4к HDR с битрэйтом до 70 лёгко. Может и больше не пробовал. В реальных не лабораторных условиях.

У станции хороший вайфай — с хорошим роутером явно не будет проблем. но 4к там даже не завявлено и HDMI 1.2 версии
Вот это, имхо, недостаток существенный.
У сеня дома ловится уже с два десятка сетей и как-то не хочется экспериментировать с каналами и ловить баги забитого эфира.
Подключил кабель — и получил гарантированный канал до домашнего архива, быстрого инета и телека.
Здесь очень много негатива по поводу того, что Яндекс якобы напрямую сливает личные данные в российские спецслужбы. Но это почти единственная компания, IT-гигант, который вызывает у меня положительные эмоции по своему поводу. Ребята реально стараются привнести на рынок что-то новое и способны конкурировать с ведущими мировыми брендами, может не стоит так активно поливать их негативом по-поводу возможной «прослушки»? Тем-более некогда Яндекс спас ТМ и Хабрахабр от пожирания его компанией mail.ru group, за что я особенно благодарен. В общем от себя скажу, что Яндекс молодцы, и, вероятно приобрету себе эту колонку поиграться. В конце концов никто не мешает ее отключать во время неиспользования.
НЛО прилетело и опубликовало эту надпись здесь
Пожалуйста, не надо фантазировать. Фантазии невозможно логически оспорить. Факты, только факты.
НЛО прилетело и опубликовало эту надпись здесь
Примеров этого выше не было. Повторюсь, фантазии оспорить невозможно. Станция технологически никуда не шлёт фон. Представьте, что вы просто голосовой командой заменяете клик мышью.
НЛО прилетело и опубликовало эту надпись здесь
Обновления прошивки, конечно, есть. Но кнопка Mute не программная. Её софтом не обойти. Вот принципиальная блок-схема. А тут подробная схема с комментариями.

image

И здесь выше, и в сети уже были примеры отказов Яндекса, если запросы не регламентированы законом.
НЛО прилетело и опубликовало эту надпись здесь

Уже давно надо было им ее выпустить. Единственное, на мой взгляд, дороговато.

Отличная вещь, обязательно куплю.
Правда я музыку не слушаю вне наушников.
А можно Станцию законнектить с существующей акустикой, которая лучше, чем у Станции?
Поддерживаю вопрос. В комплекте домашнего кинотеатра есть ресивер, Станцию планирую подключать к нему; понятно, что в StandBy видео будет передаваться в ТВ, да и звук ДОЛЖЕН (HDMI же), но будет ли?

ИМХО самая большая Killer фича станции — голосовой помощник на русском языке. Ни у Amazon, ни у Google такого нет. Используйте ее и выпускайте продукт побыстрее, пока это не сделали ваши иностранные конкуренты, которые скорей всего так не делают только потому, что им лень.
Вы либо выпускаете продукт и захватываете русскоязычный рынок сейчас, либо, если конкуренты включат поддержку русского языка, вылетаете с треском с рынка, даже не успев на него войти, так как других особенных преимуществ у вашего продукта нет.

Прежде всего, спасибо за интересный продукт. Делаю ремонт, планирую сделать multiroom систему — хорошую акустику в одной комнате и приемлемый для мытья посуды звук в других. Для этих целей Яндекс.Станция подходит прекрасно с позиции цены, качества и, главное, голосового ассистента.

Был приятно удивлен последними обновлениями Алисы в навигаторе, и верю, что колонка «сыграет» — во многом также благодаря интересной ценовой политике.
Пока для меня, как для потенциального покупателя, не рассчитывающего на хороший звук (тут будем объективными — звук «хорош» для любителей портативного аудио, но вряд ли прыгнет выше»), но желающего приобрести законченный продукт для оснащения дома и квартиры, есть один ключевой минус: отсутствие AirPlay2.

Для пользователей Apple наличие данного протокола могло бы покрыть и multiroom возможности, и интеграцию с homekit, и интеграцию с appleid. Я понимаю, что для вас актуален вопрос конкуренции — не хотелось бы давать доступ к сервисам Apple, когда есть свои, вполне конкурентоспособные аналоги.

Тем не менее, конкуренция есть конкуренция, и, опять же на субъективно личном примере, целиком отказаться от сервисов Apple в пользу Яндекса я не готов — однако годового бесплатного периода должно быть достаточно, чтобы, при желании, скорректировать свои приоритеты.

Надеюсь, что буду услышан, и удачи вам с продажами! Как минимум, одну Станцию куплю, больно интересно :)
Спасибо!
А можно будет приобрести Яндекс.Станцию и что будет работать за пределами России?
Ок, микрофон отключается физически (хотя это тоже нужно еще проверить), а как быть с динамиками в момент нажатия mute? они тоже физически отключаются? если не ошибаюсь, с помощью динамиков тоже можно слушать окружающее пространство…
Смотря как они подключены же…
надеюсь спецы по схемотехнике и безопастности смогут прояснить этот вопрос, когда Яндекс.станцию разберут до винтика. Если все будет нормально, я бы с удовольствием себе 2-3 такие домой поставил в разные комнаты
Отличный девайс. А zigbee модуль есть в нем?
Подскажите, пожалуйста, что произойдёт с Яндекс.Станцией, когда я буду слушать при ней песню группы «Секрет» «Алиса»? Или её попрошу проиграть эту песню?
попробуйте на десктопе или телефоне
BarakAdama Вопрос про микрофоны. В схеме указаны MP23AB01DH, интересно узнать, чем был обоснован выбор? Особенно с учётом того, что насколько я понимаю, сейчас на рынке MEMS-микрофонов есть достаточно большое кол-во вариантов с SNR больше 65дБ, что опять же, насколько я понимаю, могло бы достаточно хорошо повлиять на качество распознавания.
Яндекс.Алиса активируется при слове Яндекс или Алиса. А если человека зовут Алиса, неизбежны конфликты имен. необходим механизм изменения слов активации.
интересно, как с этим у Алексы, если владелец Алекс, думаю таких достаточно.
Поэтому слово «Алиса» можно отключить.
пруф?
мне из ТП Яндекса ответили что нельзя отключить.
Я не знаю, что именно вы спрашивали, но в приложении Яндекс для Android уже можно отключить.
А у меня два вопроса.
1) Можно ли её сконнектить через локальную сеть со SmartTV (например, с LG на WebOS), и чтобы она стримила видео туда без HDMI? Скажем, через Miracast или как-то еще?
2) Можно ли кастомизировать локально распознаваемое «Старт-слово»? Какой-нибудь абстрактный Джарвис там?
Рискну сделать предположения.
1) Теоритически такое возможно, если на телевизор можно будет установить клиентское приложение, которое будет делать то, что Вы хотите, станция же будет коммуницировать не с телевизором как таковым, а с приложением на нём установленном. Думается мне, что прямое управление подобным телевизором маловероятно.
2) Заявлено было, что Алису можно заменить на Яндекс. Про другие «Старт-слова» речи не шло. С одной стороны, не вижу особых сложностей для того, что бы настроить любое старт-слово, с другой стороны, старт-слова обрабатываются локально и сложности действительно могут быть. Всё зависит от реализации и от желания Яндекса сделать такую кастомизацию, ведь даже если сейчас такой возможности нет, ничто не мешает добавить её в новой прошивке.
BarakAdama спасибо Яндексу за оочень интересное устройство!
Простите мне мою невежественность, но вот после подключения к телевизору (безусловно, уже давно Smart), для просмотра найденного голосом видео, надо будет всё-равно искать пульт от телека и выбирать входной канал от Станции?
А как-же то, что пульты уже давно не ИК, что они сами с телеком общаются или по сети или по WiFi и Станция молга бы самостоятельно и телик включить и входной канал выбрать и проиграть самостоятельно и огласить программу передач на вечер и сама попереключать каналы и поуправлять звуком самого Smart TV?
Или это всё уже реализовано, а я просто задаю глупые вопросы?

(и прочитал весь тредик на сейчас, чтоб не повторяться :( )
У меня телевизору (безусловно Smart) около 2 лет и у него обыкновенный ИК пульт.
Но дело не в этом, Вы кажется не уловили как устроен сценарий взаимодействия Станции с телевизором. Она подключается к телевизору через HDMI, а значит, она не может ни включить телевизор ни тем более как-либо управлять им. Вы сами включаете телевизор, выбираете вход от Станции, а дальше она по сути выполняет роль смарт-приставки, только с голосовым управлением.
HDMI-CEC умеет и включать/выключать и звуком рулить и входы переключать. Это может работать глючно(у меня AV-ресивер выключается вместе с телевизором, а через пару секунд включается обратно), но в целом работает.
Было бы странно заставлять делать это пользователя, а значит в Яндекс-станции наверняка есть эта фича.
Я как раз-таки и уловил :)
Надо подключать кабелем, а если через кабель нет сигналов управления, то Станция оказывается не вполне с одним голосовым управлением — пульт от телика приходится всё-равно держать в доступности и включать сам телевизор и выбирать вход от Станции.
Вот выше уже подсказали, что есть варианты.
У меня Филипсу несколько лет и управляется он уже не по ИК.
Собственно, в связи с этим и вопрос BarakAdama производителю. Очень хотелось узнать, рассматривали они такую фичу для реализации или нет.
А что с защитой от выполнения чужих команд, существует ли что то подобное авторизации?

Звук производимый настоящим человеком в комнате я думаю отличается от звука любого другого устройства воспроизведения звуков. Но вот способны ли устройства это определять не знаю.

Станция будет реагировать на команды с телевизора, радио, соседей, улицы?
Например станция включена постоянно, и тут по улицам проезжает авто и человек в громкоговоритель говорит «Алиса переведи все мои деньги на кошелек №», «Алиса включи песню трава у дома» и т.п.
Или реклама той же станции по телевизору, заставит настоящую станцию в квартире повторять то что говорят в рекламе.
Читал про героическую борьбу Амазона аж двумя способами против подобного поведения Алексы, когда та на что-то из телефизора нелепо среагировала

По идее, как вариант — обучать помощника конкретному произношению ключевой фразы. Только придется это делать для всех членов семьи и непонятно, что делать с гостями.

Всё понятно с гостями, они такие же «чужие» как всё что звучит с улицы или из телевизора и должны полностью игнорироваться.
По хорошему Станция не только должна отличать своих от чужих, но ещё и различать членов семьи. Самое простое — она не должна выполнять команду «Поставь Дэдпул 2» исходящую от моего 7 летнего сына. И в тоже время она должна выполнить эту команду от меня или моей жены. Дальше интереснее. Если она нучится включать ПК (а почему бы и нет? В этом нет ничего сложного), она должна адекватно реагировать на команду «Включи мой компьютер», учитывая что у меня свой ПК, а у жены свой. Ну и дальше можно придумать ещё огромное количество кейсов, где важно различать от кого именно идёт запрос.

Ждем новых технологий… Лично я думаю, что с учетом развития беспроводных технологий и различного рода направленных сканов в гигагерцовом диапазоне — а-ля радарная техника в условиях квартиры, распознавания лиц и пр., устройства типа Яндекс.Станции будут способны идентифицировать находящихся в квартире людей по их биополю/электромагнитному отпечатку и соответственно реагировать на исходящие от них команды. Вероятность ошибки должна будет снизиться.

А можете написать отдельную статью про ваш волшебный Phrase Spotting? Теория, реализация, грабли?
Barakadama, очень классная разработка для нашего рынка. Очень хотелось бы почитать, как происходит тестирование данного устройства и его ПО.
Подскажите пару вопросов:
1) Можно ли будет проигрывать видео со сторонних сервисов, аля ютуб/рутуб?
2) Можно ли подрубать внешний диск по usb и смотреть видео с него?
3) Будет ли софтина, чтобы можно было управлять станцией с телефона?
4) В продолжении софта, будет ли возможность докупки отдельных микрофонов, чтобы по всей квартире была Станция доступна?
5) Будет ли в ней родительский контроль?
А в яндексе появился свой отдел разработки железа или аутсорс/партнерство?
Свой. К нам присоединились специалисты в этой области.
тогда вопрос — почему нет аккумулятора никакого? я бы себе хотел на стол поставить как раз как помощника заточенного под русский язык, заметки делать, когда руки заняты. Да и вообще кейсов использования как переносную колонку достаточно даже в пределах квартиры — например к телевизору подключается для просмотра фильмов иногда, в остальное время удобней чтобы стояла на рабочем столе, на кухне, в спальне и т.д. Но шнур это все ограничивает
Случаем не вот такие?
yasdelie.ru
Просто по платам видно что разрабатывала команда которая не первый день замужем, с одной стороны. С другой стороны — если бы это была бы постоянная команда — поставили бы DSP для такой задачи. Значит софт и железо делали разные команды, причем поддержкой и дальнейшим улучшением будет заниматься команда программистов, которые с DSP не работают.
Ну, что сказать. Продукт не очень из-за качества звука. Звук 2 из 10, я в основном саб слышу. С верхними совсем беда. На низкой громкости одно сабово бухтение. Поставил вечером ребенку колыбельную, так даже слов не разобрать.

К макбуку подключил, работает. Можно даже вытянуть высокие эквалайзером до более-менее китайского уровня звука. Но все портит кодек SBC. Выше — никак.

С мобильником та-же беда, но на моем SGN-9 глухой SBC и связь всегда рвется через пару минут.

К телеку подсоединил. Тоже фейл. По фразе «покажи новые фильмы» Алиса что-то находит, а вот «покажи все новые фильмы в жанре фантастика», «покажи новые фантастические фильмы» или даже «покажи новые фильмы за 2018 год» — фейл, ничего не находит.

В общем, за 10К вы получаете бухтелку с Алисой, которая умеет совсем немного.
НЛО прилетело и опубликовало эту надпись здесь
Выглядит так, будто у вас проблема с высокочастотниками. Пришлите, пожалуйста, серийный номер в личку. Передам коллегам для анализа.
Да, передайте для анализа Круглову привет. Вам не стоило брать второсортный товарняк, вместо колонки у вас бухтелка. Синтез Алисы забили низами. Институту Фраунгофера вы за что заплатили? Станция по моим ощущениям не работает нормально на дальностях свыше 3х метров. Микрофоны у вас полная лажа, 100% ущербный вариант. Эта компания занимает 1-3% рынка MEMS микрофонов. В 2017 году мы уже ставили микрофоны c SNR 67.5 дб. Дальность работы нашей колонки составляла 7 метров. И производит их компания, которая имеет долю на рынке — почти 2/3 от мирового. Скажите, может ли компания с бюджетами, уступающая лидеру рынка на порядок, делать качественные микрофоны. Нет, не может. Одни из лучших русских инженеров в плане экспириенса работают в московском офисе huawei, вам бы стоило привлекать к проекту опытных инженеров-акустиков, они, кстати, подтвердили бы сказанное тут.
тоже удивился микрофонам от ST за полбакса с SNR 65dB когда уже 74dB делают, как бы экономить пару баксов, теряя при этом 6dB-10dB в динамическом диапазоне в устройстве у которого речь это единственный и основной источник ввода данных — ну такое.
Я не могу разглядеть на фото, но похоже что конденсаторы развязки по постоянному току керамические, а не пленочные? Тогда еще докинуть к шумам можно микрофонный эффект керамических конденсаторов.
АЦП тоже интересно было бы посмотреть, но смущает немного компоновка и разводка платы и то что я не вижу ни одного электролитического конденсатора и разделения аналоговой и цифровой части — дифференциальный выход на микрофонах это конечно хорошо, но цифровые шумы по питанию никто не отменял.
Была возможность потестить немного на конференции — в шумном помещении открытом расстояние 1м примерно рабочее стабильно, кроме того — не со всех направлений слышит, но в целом — вполне достойное распознавание благодаря тем кто делал ЦОС. Но чтот с аналоговой частью как то да — не особо как то похоже на аналогово цифровые платы которые я привык видеть. Обработка это замечательно конечно и снимаю шляпу что программа из этого что то вытаскивает, но ведь эти 6-10dB динамического диапазона они ничего не стоят же — купить микрофоны чуть подороже, чуть получше развести плату и это бы сэкономило время программистов которые из худшего сигнала пытались выжать вменяемый результат, про то что при этом детектирование, наведение и вот это вот все работало бы автоматически гораздо лучше и в нормальных условиях давало лучший пользовательский опыт я не говорю уже — ведь от того как фазированная решетка навелась, как отсекла шумы и тд и тп зависит то какого качества запись будет для распознавания в облаке. Получается что из за пары баксов сэкономленных на микрофонах и разработчиках аналогово-цифровых устройств — падает качество работы всей системы.
P.S.
На самом деле — как разработчик могу сказать что для чисто софтверной компании результат очень и очень достойный, найти и привлечь разработчиков с принципиально новой для компании компетенцией, производство наладить, промышленный дизайн и еще куча всяких областей в которых у компании нет компетенции, процессы не выстроены под это, нет опыта HR таких людей и вообще работы с ними… И в итоге всех найти, организовать, состыковать и выпустить в продакшн продукт который сравнивают с лидерами мировыми — это очень круто, думаю пройдет немного времени, набьют шишек, найдут людей и все будет в разы лучше
Они вместо разрабов наняли шлак. Помимо вашего замечания я заметил вчера отсутствие пикофарадного конденсатора между выводами каскада, так делают, чтобы не оцифровывать высокочастотный шум, который имеет свойство проникать по питанию. В рекомендациях на сайте ST есть примеры и формула расчета емкости оного.
Эти микрофоны еще и не очень надежны в плане качества. Известна высокая капризность MEMS технологии к условиям пайки. Приводит это к разбросу параметров SNR и чувствительности при нарушении условий монтажа. Также эти микрофоны чувствительны к отмывке изделий, к составу и к обработке давлением.
65 дб — это уровень MEMS технологии образца 2015 года. Каждый год уровень MEMS растет на 1.2 дб. Реальное коммерческое применение имеют микрофоны с SNR 70. К сожалению описанные вами микрофоны с 74дб — пока выдумка, но уже на подходе — конец 2020 года. 70 дб работает на дальности до 10 метров. Реальный пример устройства я уже успел увидеть. К сожалению, рубеж в 75-76 дб мемсу будет тяжело преодолеть и скорее всего дальше будут развиваться уже другие технологии. К 2024 году технология достигнет насыщения.
Всё этого было известно компании Яндекс, которая имела ряд NDA, подписанных с другими стартапами. Также имеется персональная переписка с руководителем проекта Станция — Кругловым. В разработчики они взяли по электронике в том числе бывшего сотрудника стартапа Кубик. По результатам работы видно, что устройство может быть лучше в плане акустики. Скорее всего текущий результат связан с отсутствием реальных компетенций по обработке звука с массива микрофонов, оперирование чужими исходниками и как следствие неполное понимание задачи от и до.
Компания строит хайп вокруг проекта. У компании есть контент. Но в компании нездоровая атмосфера в руководстве, которая реально позволяет совершать глупые поступки и принимать постыдные решения, наносящие ущерб той части продукта, в которой не разбирается даже руководитель.
ну рано говорить про руководителя — он не должен разбираться в технических деталях всех мельчайших, станция далеко не основной продукт яндекса — все таки это средство доставки основного цифрового продукта. Даже если в какой то момент разработки стало понятно что получается не очень — все равно с точки зрения бизнеса будет правильней доделать как есть продукт и зарелизиться чем чистить команду, менять все и откладывать все на год. Как инженер я вижу конечно ряд моментов которые можно было бы улучшить, в какие то вещи вроде подмеченных выше вообще верить не хочется что это продакшн компании уровня яндекса
Но потом я вспоминаю что это делала с нуля компания которая никогда ничего подобного не делала, вспоминаю как тяжело найти в России сейчас компетентных хоть более менее инженеров которые еще не свалили отсюда, вспоминаю специфику работы с такими инженерами и насколько она отличается от работы с программистами и понимаю что выпустить в принципе что то более менее рабочее включающее в себя достаточно непростую в плане разработки область типа фазированных микрофонных решеток — и язык не поворачивается сказать что это фуфло.
Хорошо ли отработало руководство проекта в итоге определяется тем насколько это решило бизнес задачи и принятыми решениями после анализа ошибок, которые всегда будут в первом продукте, без опыта. Интересней посмотреть на дальнейшее развитие, я честно говоря вообще не верю в рынок голосовых помощников в России — думаю история скорее имиджевая, ну или задел на будущее, не думаю что на данный момент даже с офигенной реализацией это какие то прибыли заметные — сколько должен продуктов яндекса больше начать потреблять пользователь с колонкой или потреблять других продуктов через яндекс колонку чтобы отбить RnD?
Сейчас просто нет ни механик рабочих нормальных, ни какого то рынка реально устоявшегося голосовых ассистентов — это скорее платформа для разработчиков, закинутая удочка чтобы начинать какой то опыт пользовательский анализировать и прорабатывать.Это явно таймфреймы не один год на которые это все рассчитывается — опять же, лучше с какими то данными и пользовательским опытом уже начинать работать, чем делать идеальную колонку и релизить ее без собственно контента которая тебя слышит из туалета, только вот ничего ответить тебе не может по делу
P.S.
Я так понимаю какие то личные обиды есть — по моему опыту чем раньше это отпустить тем лучше для всех, думаю следят за темой участники команды и примут к сведению замечания. А делать выводы о целесообразности и правильности чего то не зная всего процесса не вижу смысла — нам часто кажется что область в которой мы специалисты это самое важное, но самое важно для любой компании это зарабатывать деньги и наша область это всего лишь один из факторов который на это влияет
Да, есть личный обиды. Давайте я их отпущу… сюда.
Я проходил собес на разработчик железной части Станции.
Оно включало фактически 13 этапов. Я получил согласие руководителя проекта Станция и приступил к посещению некоего вида собраний. Это было перед стартом проекта. Обсуждался функционал, алисы еще не было, рассматривался вариант использования другого движка, мы привезли в яндекс прототипы, показали код формирования диаграммы направленности, локализации, VAD, графики, железный массив микрофонов, подписали документ. Тогда команды не было, фактически Круглов взял помощника и фактически все, что было сделано — заказано пару железяк и в целом был полный вакуум. Именно тогда шли активные дебаты — делать видеовыход или нет. Синтеза тоже еще не было. Отделы Яндекса еще не знали о работе и в целом не было даже взаимной кооперации. В силу наличия проблем взаимодействия рассматривались варианты использования сторонних решений. Спичкит тогда тоже был в зародыше и работал так себе.
Круглов — руководитель проекта Станция, фактически занимался раньше рекламой. При этом ему рекомендовали нас люди, которые фактически продавали спичкиту датасеты в Яндекс, а также имели обширный опыт работы в компании №3 по распознаванию русской речи и были совместные неформальные встречи. Мы проявляли действенный интерес, много спорили и не скрывали по крайней мере мы от них реального положения дел и необходимых действий, проводили оценку сроков, бюджетов, состава команды.
Вместе со мной были приняты другие люди, мы письменно спрашивали подтверждение и руководитель в письменной форме в составе личной переписке подтвердил это.
Но вот дальше начались интересные вещи. После первого собеса например мне назначили второй собес. Затем после второго — 3й собес.И в итоге в форме Яндекса, где принимают сотрудников у меня значилось что-то около 12 оценок от разных людей. Яндекс также нанял что-то типа внешнего аудитора по тех. части — человека, который не был в составе яндекса, но работал технарем в дизайн хаусе. Начали складываться мысли, что всё делается для того, чтобы не допустить нас к проекту. После этого когда мы дали подтверждение HR о согласии на оплату — договорились по сумме, настало 2 недельное ожидание даты выхода в проект. После 2 недель руководитель написал о необходимости еще времени на решение вопросов с трудоустройством, затем… спустя месяц в наглой форме написал о том, что мы якобы уже не подходим и можем идти куда подальше.
Знаете, мне зачастую плевать на сумасбродов и откровенно людей, ведущих себя как дураки. Но меня поражает 2 других момента:
Момент 1. Яндекс на эту позицию взял сотрудника стартапа Кубик. А теперь внимание — этого сотрудника в Кубик устроил Я. А теперь внимание — как это было. Когда из кубика свалил железячник я не нашел ничего более простого, как устроить туда своего знакомого, которого фактически брали паять диоды на ардуинку. Он не смог начать делать массив микрофонов и кубик отвалил эту задачу на аутсорс, причем отвалил ее человеку, который работал на нас. Круг фактически замкнулся. Да, мы платили ему, знали об этом они или нет — не знаю. Но у них получался отвратный бестолковый массив микрофонов без обработки — тупо дампер данных, дорогой, сложный, большой.
Как зовут — ну в Яндекс он именует себя Александр Брад. Был левым разработчиком, случайным — не из команды кубика.
И Круглов повелся на легенду и взял его в Станцию. Зачем это было сделано? Полагаю, что глупость — одна из причин, другие не хочу обсуждать.
Почему вы продаёте Яндекс станцию только в мудоебском Беру?

Оч хотелось попробовать железку вживую на предновогоднем мероприятии, заказал в Беру Яндекс.Станцию 13 декабря, доставку назначили на 17 декабря. 17-го курьер не приехал и никто даже не позвонил, по трекингу на сайте DPD стоял статус «заказ возвращён на склад». Сотрудники колл-центра Беру объяснили ситуацию «техническим сбоем» и в качестве компенсации обещали отправить купон на (!) 500 рублей. При этом возврата денег за заказ я до сих пор не увидел.

В итоге праздник был безнадёжно испорчен а как следствие в моих глазах безнадежно испорчена репутация не только Беру, но и самого Яндекса, раз он сознательно продаёт свои железки только в маркетплейсе с ужасным клиентским сервисом.
Зачем такие слова? Может, Станция сама вашим голосом позвонила в доставку, и отменила свою отправку? Ну вот не понравились вы ей (по фотографии из личного дела Яндекса на человека с таким ником и такими данными паспорта)!

Или она еще не умеет голосом конкретного человека звонить?