Как стать автором
Обновить

Комментарии 47

Классная поделка! Как идея для следующих релизов, вместо квадратных зрачков глаз делать треугольные при проигрывании музыки, вроде такая фича была в Бендера.
Спасибо!
Ну они сейчас хардварно квадратные:) Это надо какие-нибудь экранчики в глаза тогда.
Вообще так бы и рот сделать экраном гибким было бы классно, чтобы его «мимику» из мульта повторить.
надо какие-нибудь экранчики в глаза… и рот сделать экраном

Тогда уже получится LEXX, а не Футурама image
Самый симпатичный вариант умной колонки, из тех, которые я видел.

Да уж, это не бездушная Алиса

Идея — агонь!
Отчаянно нехватает движения глаз и век.
Если поставить пару-тройку микрофонов, можно запилить поворот глаз на говорящего.

Или поворотной на все 360 подставки.
Главное, чтобы автор не останавливался на бета-релизе)

image
Пока остановился:) Дальше посмотрим как будет вдохновение.
Спасибо!
Да, мне тоже не хватает.
Причём это заложено в конструкции:
image
Но когда разрабатывали я подумал, что колонке управляемые глаза не нужны, сейчас об этом немного жалею.
А вот товарищи из Италии сделали ремикс модели брата(но по железу используют ESP8266, распознавания у них нет) и добавили выезжающие глаза(а ещё съезжание крыши Бендера от магнита):

Двигающиеся глаза добавят жизни, это точно. Можно еще отдельно руку, чтоб пальцы шевелились и всякие знаки могли показывать, козу, виктори ну и прочее по желанию. Потрясающая работа. Весело и со вкусом.
С рукой для меня точно слишком:) Вообще в принципе хотелось, чтобы он был достаточно простым и из недорогих деталей, чтобы другим при желании не так сложно было повторить.
Вот в машинку посадить была мысль:
image
Видел в сети несколько проектов манипуляторов типа рука, также на принтере печатанные, можно было бы как опцию сделать. =)

Очень круто! :D


Лезет ещё в голову что-то типа:


speech to text -> GPT-3 -> text to speech

Спасибо!
Мне тоже лезет, но пока лень сильнее:)
Мне срочно нужна такая же колонка :D вам бы открыть свое производство и продавать этот шедевр
На самом деле это не consumer-ready продукт, чтобы его продавать.
И даже если допилить есть несколько моментов:
1) Собственно самый главный — копирайт. Futurama — собственность Fox, а теперь тем более это Disney. Я почитал на тему лицензирования у Disney, пишут, что их обычно интересуют суммы от 6 нулей в долларах. Я послал им запрос на почту в декабре(так как меня уже спрашивали люди на Ютубе и Реддите о возможности купить в виде кита), но думаю либо ответа не будет вообще, либо «нам неинтересно». Ещё хуже если вообще скажут: «Удаляй всё с Ютуба нафиг!»
2) Политика продажи Raspberry Pi Zero — одна штука в руки. Поэтому явно придётся переделывать на что-то другое в таком случае.
3) 3D-печатью своими силами много не напечатаешь, я так условно прикидывал, сами сможем 1 штуку в неделю производить. Для массового производства надо форму делать, это всё очень приличные вложения.
Ну на счет копирайта можно же быть хитрее.
Вы можете случайно выложить исходники для 3d печати. А продовать начинку, с инструкцией что можно распечатать еще корпус, вот пример, но сделайте его сами.
Они выложены специально:)
Проект открытый изначально, и модель, и софт.
Но если заглянуть на лицензирование Disney, то получается что даже для "for non-commercial uses such as hand-made artwork, clothing, themed private parties, student projects, stage shows, etc." — надо просить разрешение.
На Etsy много продаётся товаров диснеевской тематики. Видимо никого не трогают, пока не появляются большие суммы, или кто-то не пожалуется.
Но я для себя считаю, что правильно было бы платить роялти создателям Футурамы. Благодаря им этот проект в принципе появился, и если зарабатывать на этом, надо однозначно отдавать долю авторам.
Ну, так если в результате будет ощутимая доля, тогда с ними можно и поговорить. А пока что работа юриста будет стоить куда больше чем они смогут получить. В лицензию они это внесли исключительно из тех соображений, чтобы когда раскрутился некоммерческий проект, можно было предъявить претензии.
Вот если представить, что я пойду на какую-нибудь краудфаундинговую платформу с проектом, затрагивающим копирайт Диснея(да не важно чей, любой копирайт, на который у меня нет прав), как думаете они примут такой проект?
Мне почему-то кажется нафиг пошлют.
будет куда обиднее, если вдруг в диснее прочухают про эту колонку и наклепают таких же, потому что им можно
Да пусть делают)
А я буду брюзжать, что первым сделал))
Но вообще такое ощущение пока, что Футурама для Диснея, не пришей кобыле хвост.
Они не транслируют её у себя на Disney+. Неформат для основной аудитории Диснея.
Очень круто. Хочу сделать также
Может сделаете производство?
Вы большой молодец, вышло просто супер, успехов!!!
Классно молодец! По поводу распознавания команд — не хватает избирательной направленности микрофона, массива микрофонов с дальнейшей DSP обработкой. Да и акустическая конструкция (расположение микрофонов, динамика, демпфирование, экранировка) играет не последнюю роль.

Я бы в первую очередь поставил правильный и каноничный процессор, проверенный временем.


Это да. У нас отечественная пиратская подделка, поэтому Pinder:)
Я летом купил такую штуку — https://wiki.seeedstudio.com/ReSpeaker_2_Mics_Pi_HAT/. Эта с двумя микрофонами, а там ещё есть и 4, и 6, и вроде 8.
И начал делать то ли вторую версию Бендера, то ли сына Бендера, то ли безумного робота Роберто.
Неплохо в принципе работает, но как-то у меня уже топливо на этот проект к тому моменту истощилось. Ща валяется на даче, может ещё сделаю что-нибудь с этим.

Жаль всё это только в зачаточном состоянии сейчас.
Нормального открытого ПО для работы с массивами микрофонов нет, нет стандартизованных модульных интерфейсов для голосовых помощниуов, Алиса та же едва-едва покрывает долю процента от потенциальных возможностей концепции.
Вглядит, конечно, будто вот бери малинку и делай, все технологии есть, но по факту работы не меряно и потянуть в одно лицо такой проект, чтобы было юзабельно — это очень трудно. Вон даже гигантский яндекс пока что не выкатывает толком норамльных возможностей, а откровенно слабый АПИ для скиллов рубит огромное количество классных идей.


Голосовым помощникам очень не хватает качественной универсальной и стандартизированной аппаратной работы с голосами, с локацией их в пространстве, с конецепцией multiroom, с языками, с интонациями, акцентами, ударениями.
В софте не хватает поддержки вложенных и смешанных контекстов, возможности смешивать скиллы для одновременной работы в одном контексте.


Много всего можно сделать сейчас. Рынок в этой отрасли как дикий запад. Вон люди пишут тупые игры для алисы и выигрывают конкурсы яндекса на них. Очень не хватает качественной открытой аппаратной части для типовой колонки. Тогда, мне кажется, будет прорыв.

Честно скажу я никакими голосовыми помощниками и не пользуюсь:)
Фото где наш Бендер на Яндекс.Станции — у брата.
Этот проект, он именно что пародия на умные колонки, арт-проект, игрушка.

Вглядит, конечно, будто вот бери малинку и делай, все технологии есть, но по факту работы не меряно и потянуть в одно лицо такой проект, чтобы было юзабельно — это очень трудно.

Здесь смотря для чего, делать что-то глобальное, соглашусь — неподъёмно(хотя может для какого-нибудь очень продуктивного гения и реально, не буду категоричен).
А вот сделать что-то по фану вполне достаточно, даже вот оффлайн.
коутейшая штука. хотя я и не любитель всех этих колонок) но сделал бы. 3д принтер есть
Можете просто напечатать корпус)
Или например можно его использовать как ночник:
image

не подскажите ссылку на 3д модель которую использовали вы?

Какой Pinder это же Benderasp самый настоящий!!!!

:)
Модель выглядит очень хорошо обработанной и не скажешь сразу, что это на 3д принтере (очень гладко). Было б хорошо про «механическую» часть узнать, как делалась
К сожалению брат вряд ли будет писать статью по своей части.
У вас есть какие-то конкретные вопросы?
На странице 3D-модели есть небольшое описание: https://www.thingiverse.com/thing:4384974
И сзади, вблизи хорошо видно, что 3D-печать:
image

Неплохая помехозащищенность и скорострельность. И никаких Linux :)

Для меня Linux — плюс. Я использую его в том числе просто как сервачок для тестов иногда.
И если бы сейчас делал продвинутою версию, взял бы или полноразмерную Малину, или что-то подобное с графикой помощнее, чтобы ещё и как консоль к телевизору использовать.

Спасибо за статью! Я давно планирую своего "робота", говорящая злая голова + роботизированная рука )) Планирую на платформе Nvidia jetson nano 2GB (около 50$). Плюсы, что много всего для нейросети от Nvidia уже идёт. Кстати, я в 15 минутах от Диснея живу (в Орландо), могу к знакомым коллегам обратиться по вашему вопросу ))

Да, на Джетсоне можно конечно гораздо больше всего накрутить, хотя бы даже распознавание на Mozilla DeepSpeech должно нормально работать(правда когда я пробовал летом была беда с сэмплами плохого качества, в то время как Microsoft STT отлично справлялся, но всё равно было бы очень интересно попробовать на Джетсоне).
Если «за спрос денег не берут», тогда поинтересуйтесь)) Спасибо!
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации