Imperius1417 мая в 21:00

Как я загрузил компактную открытую LLM в робота и сказал ему ходить (и хватать)

Средний

20 мин

16K

Искусственный интеллектМашинное обучение * Робототехника

Кейс

+19

Комментарии 10

Guron1989 17 мая в 22:27

Думаю эта больше подходит для поста)

Motvikios 17 мая в 23:56

DamonV79 19 мая в 06:18

Спасибо за статью, весьма познавательно!

У Вас нет планирования маршрута перемещения (самого робота или исполнительного инструмента) моделью. По сути, Вы натренировали вызов тулов моделью. По этому интересен момент, а насколько ванильная FunctionGemma с переданным ей списком тулов справится с заданием?

Imperius14 19 мая в 06:27

ванильную гемму я проверял в начале статьи, она жестко галлюцинировала, поэтому и понадобился файн тюнинг.

Собственно, гугл изначально и обозначил что это модель для файнтюна а не для использования ванили как есть.

А зрением для модели, чтобы она могла сама находить нужные предметы я ща занимаюсь, должно получится интересно.

DamonV79 19 мая в 12:16

ванильную гемму я проверял в начале статьи

Не ванильную Гемму, а FunctionGemma (https://ai.google.dev/gemma/docs/functiongemma). Google'ом зафайнтюненая версия Gemma3 для вызава тулов. Возможно, даже ее ванильная версия будет приемлема, если ей просто список тулов передать.

Imperius14 19 мая в 12:20

а, вы про это, извиняюсь. Спасибо, гляну

Imperius14 19 мая в 06:33

Но фактически да, это файн тюн на вызов тулзов, надо было обозначить это в статье, что вся эта эпопея показывает что модель потенциально можно использовать в агентных сценариях. Спасибо за комментарий

JackCarter33 24 мая в 12:26

Превосходная работа! Очень радует видеть движение в этом направлении не только ИТ гигантов.

Архитектурно я бы добавил VLM модель или хотя бы простейшую YOLO (но тогда не будет семантики)

Малинки Zero конечно не хватит, но какой-нибудь смартфон или Orange Pi 5 с лихвой.

А как наладить сообщение между VLM/LLM моделью, остальными сенсорами, добавить "восприятие времени" и упаковать в компактный промпт писал в:

https://habr.com/p/1023564/

Imperius14 24 мая в 19:52

Спасибо за такую рекламу себя (без ироний). Добавил статью в закладки, поизучаю ее попозже более подробно обязательно

JackCarter33 25 мая в 11:47

Это скорее приглашение к сотрудничеству и диалогу, как бы "посмотрите, я работаю над похожим по смыслам проектом и у меня есть часть решений с других ракурсов, мы могли бы использовать общие наработки т.к. опенсорс в ру сегменте не блещет изобилием..." Спасибо за отклик

Зарегистрируйтесь на Хабре, чтобы оставить комментарий