Обновить
56
0
bugman@bugman

Make software to happen

Отправить сообщение

Неа. Все эти фичи без чатажпт можно реализовать.
По поводу стт начните с виспера. Для английского языка он на уровне гугл, не то что яндекса. Для русского модели тоже есть, но пока кривоватые, видимо придётся свою тренировать по данным коммонвойса

Я думаю проблема действительно существует, но она не так широко распространена.

А почему "не сравнивают"? Закон какой есть запрещающий? Бывают отличные продукты занедорого (редко). Бывает говно задорого (чаще). Разные ценовые категории еще не повод не сравнивать

Видимо качество яндекса не устроило, раз модели уровня "похуже" не интересуют? Всегда есть куда падать в хотелках, пока мы не упали до условного сфинкса?

Это очень интересная и свежая мысль. Я уверен, что можно. Вопрос какая из существующих моделей будет лучше работать на каждой конкретной железке. Наверное какое-нибудь сателлит приложение тут пригодилось бы, которое бы отбенчмаркала конкретный девайс и дальше само решило, как его использовать - тупо как доп микрофон или оффлоадить на него что-то

О, круто. Спасибо что поделились. Сонофф мне всегда нравились вот этим своим визионерством. Первые ласточки стало быть полетели.

Приз за самый лучший вопрос уходит зрителю с ником @mm3
Я подробно расскажу о своем сетапе, когда увижу, что тут есть достаточное количество людей, которые этой темой интересуются.
Забегая вперед - никаких чудес и откровений. Обычный мини-пц из относительно свежих мобильных интелов предпоследнего поколения (N5095) с 16 Гб ОЗУ. Сверху Линукс. С микрофоном пришлось повозиться методом проб и ошибок, как и с его бустом и фильтрацией шумов. Да и как с аудиостеком линукса - для меня до недавнего времени ALSA, Pulseaudio, Pipewire, Jack были тарабарщиной. Линукс то я худо бедно знал, но не десктопный.

Я говорил хоть слово про "сетку уровня ChatGPT"?
А вот "хорошую распознавала голоса + что-то что будет понимать смысл сказанного и разумно отвечать и действовать?" это да, уже кручу. И для этого вам не нужны генеративные предтренированные трансормерные нейронки

Здравствуйте, коллега

"Мощностей и мозгов у них маловато чтобы распознавать, записывать, напоминать и тому подобное"
это не так. Точнее не совсем так. Если мы говорим за совсем дешевые модели, типа 3-5 тр, то да, за эту сумму много вычислительных мощностей не положить. А если мы говорим за сумму от 10 тр, то это уже вполне intel N5095 mini pc

Для русского языка, я думаю прямо чтобы "не хуже яндекса" еще нет. У Яндекса очень сильная команда по этой части. Есть только "похуже яндекса" и "сильно похуже яндекса".

А количество приложений под андроид не является этим самым "толком"?

Где вы прочитали "давайте сделаем свою колонку"?

как вопрос сформулировали, так и ответил :)

Все те кто производят подобные устройства естественно заточены на получение прибыли, основной способ получения прибыли подсадить на подписку, а потом еще эту самую подписку начать дробить и то что было раньше в нее включено начать продавать за отдельные деньги

В самую точку. Я все жду, когда какой-нибудь Minisforum или Beelink, которым не надо повышать продажи своих стриминговых сервисов, запилят свои minipc в новом форм-факторе колонки-с-микрофоном (как Алиса) и будут ставить туда сразу из коробки не Windows а Linux преднастроенный.

У меня и самого примерно схожие критерии. Если вы пользуетесь Linux, поставьте на поиграться пару проектов из списка - https://github.com/topics/voice-assistant а потом представьте себе что это крутится не на вашем ноутбуке / стационарном компе, а на mini pc формата яндекс станции, с хорошей аккустикой и чувствительным микрофоном.

А поводу поддержки. Вы когда-нибудь пробовали обращаться например в Яндекс за поддержкой их продуктов? Например той же колонки? Знаете, у меня много потребительского опыта обращения в поддержку совершенно разных продуктов разных компаний, и в целом у меня складывается впечатление, что большинство компаний делают всё, чтобы у пользователей не было никакого желания туда обращаться.

Компании делают коммерчески успешные продукты с применением своих собственных проприетарных наработок в железе, но в качестве сердца используют opensource.
Замените в своем вопросе "колонка" на "телефон" и перечитайте его:

Почему вы считаете, что если сделать ПО колонки open source, то это будет прибыльно для производителя? Какая может быть профицитная модель монетизации у такой колонки? Что ваш open source есть будет?

Именно. Выходит тогда вы сами себе противоречите?

"Пользовательские" продукты, которые пишут ИТшники для ИТшников, чаще всего так и остаются вечно в полудоделанном состоянии.
Вот это истинная правда. Но я скажу больше. Этой "полудоделанностью" страдают в разной степени и многие комерческие продукты для широкого рынка.

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность

Специализация

Технический директор, Архитектор программного обеспечения
Ведущий
Git
Linux
Docker
Базы данных
Высоконагруженные системы
SQL
Английский язык
Разработка программного обеспечения
Алгоритмы и структуры данных
Разработка решений по интеграции