daniilshat Jan 15 at 17:11

Raspberry Pi представила AI HAT+ 2 — модуль для локального запуска генеративных моделей

1 min

13K

Development for Raspberry Pi * Artificial IntelligenceMachine learning * Computer hardwareStudying in IT

+14

Comments 22

horon Jan 15 at 17:23

Крутяк, к home assistant прикручу. А есть железки адаптированные для TTS моделей? или всё так же на GPU пускать?

avshkol Jan 15 at 17:25

Вот же вроде: https://github.com/hailo-ai/hailo-apps/blob/main/hailo_apps/python/gen_ai_apps/voice_assistant/README.md

horon Jan 15 at 17:34

Спасибо, добрый человек, поизучаю. А вот силеро модельку интересно можно запустить или нет?

avshkol Jan 15 at 17:38

Как я понял, всё, что на ней запускается, должно быть предварительно доработано именно под это железо.

Думаю, умельцы доработают всё что только можно в ближайшие год-два под неё. Потому что это 120-долларовая альтернатива видеокарте за 300...500 долл.

jarkevithwlad Jan 15 at 18:47

а разве не лучше взять старую rx580 за 100$ ? так же 8гб вопрос только в скорости реальных моделей, ну правда к rx580 нужен ещё и весь пк но наверняка можно собрать что то на старых железках, главное gpu что бы полностью вмещал модель

avshkol Jan 15 at 18:59

6 терафлопсов у rx580 против 40 тераопсов у этой штуки (что соответствует от 20 до 40 терафлопсам, в зависимости от алгоритма)

kostoms Jan 16 at 00:55

У хайла этого ещё и потребление 2.5 ватта, что для постоянно включенной машины немаловажно.

jarkevithwlad Jan 16 at 06:39

звучит слишком хорошо, если можно будет объединить 2 таких штуки или чип в ней заменить, что бы было 16гб, можно было бы запускать большие модели типо gpt-oss 20b но звучит слишком хорошо))

kostoms Jan 16 at 09:54

Сложно получится. У малины один PCIe 2.0 x1. У хайла PCIe 3.0 x4. В принципе надо какую-то плату PCIe-расширителя подбирать (и они есть) которая бы одним концом к пишке подключалась бы, для загрузки моделей и, собственно, общения с ними. А там на плате устройства могли бы общаться друг с другом напрямую, без участия пишки. С видеокартами так делают. А с хайлом этим - во-первых непонятно может ли он в такой режим, а во-вторых неочевидно, что овчина стоит выделки с его производительностью. Если скорость неважна и хочется попробовать, то можно просто на процессоре пишки крутить модель: https://byteshape.com/blogs/Qwen3-30B-A3B-Instruct-2507/ или можно использовать 7B модели.. Но для такого и пишку не надо.

Areso Jan 15 at 20:19

ИМХО, ни разу не альтернатива. 1,5 млрд параметров это мало. Это очень слабые модели. Видеокарта за 300 долларов, условно RTX 3060-12 покажет совсем другой уровень.

kostoms Jan 16 at 01:01

7 миллиардов параметров там поместится свободно, для маленьких контекстов может и больше, так же можно заоффлоадить часть слоёв модели на CPU

KivApple Jan 15 at 17:55

По каким интерфейсам такие штуки связываются с CPU малинки?

JerryI Jan 15 at 18:40

Судя по всему через LVDS линии, которые юзаются для камеры. Должно быть шустро

kostoms Jan 16 at 01:16

PCIe 2.0 x1 на проприетарном разъёме..

Animkeee Jan 15 at 18:56

А если использовать квантование, возможен ли запуск моделей Gemma-3-4b-it, или, может быть, какой-либо Phi 2.5?

achekalin Jan 15 at 19:03

А почему бы не 32 Гб хотя бы?

Bardakan Jan 15 at 20:28

потому что память нынче дорогая, а они и так уже повышали цены

Vitrion Jan 15 at 19:52

"Она построена на базе ИИ-ускорителя Hailo-10H (40 TOPS) и оснащена 8 ГБ встроенной оперативной памяти для инференса моделей.". На уровне RTX 2060 (51 TOPS), к примеру RTX 5060 TI - 757 TOPS (Gemma3 12B работает локально со скоростью 50 токенов в секунду), RTX 5090 - 3356 TOPS. Так что всё это шалости

GooseWing Jan 16 at 03:10

Не забываем о габаритах и энергопотреблении одноплатников.

ZanZy Jan 15 at 20:06

Весьма вещь в себе. В основном заточена проигрывать свои собственные примеры. Шаг в сторону - и танцы с бубнами чтобы заставить хоть что-то хоть как-то заработать. И только под одной версией ОС. Лучше взять Джетсон и не мучить задницу. На Джетсоне такая же КУДА, как и на любой нвидии, всё работает, что работает на настольной платформе, на той же ОС.

linux-over Jan 16 at 07:31

не совсем по теме, но вопрос похоже связный

вкратце, у меня есть старенький ноутбук Lenovo. Ну как старенький - ему пять лет. Одна из моделей Lenovo, которая в момент покупки была gen1. Модель Lenovo до сих пор выпускается, в том же корпусе и так далее, но сейчас она уже gen13.

Так вот, моя машинка уже то там сломается то здесь, то разъёмы ей перепаяют, то клавиатуру. Но ещё CPU что-то шалят.

В общем задумался я взять новый взамен старого. Так вот у нового помимо прочих улучшений есть ещё и нейромодуль какой-то.

Поглядел я по другим современным компам - нейромодуль многие ставят. А вот софт для них я пока не вижу. Кто знает, чем этот нейромодуль можно загрузить, а главное - на Linux?

zeleniy_kaktus Jan 16 at 08:03

На Windows я использовал LM Studio, для Linux возможно удобнее будет Ollama. LM Studio подхватывала нейромодуль АМД сразу, про Ollama не знаю, не проверял.