Комментарии 3
можете меня поправить, но по-моему лучше взять 2b модель, хотя даже 2b ту мач для таких задач, тем более что вы её квантуете в итоге. Вам 16 gb базовой теслы на колабе в таком случае хватит с головой. В идеале instruct модель, какое-нибудь семейство qwen (не помню, есть ли у геммы instruct модели). Но 70 строк на лору с таким лоссом в проде… будет печально
Технически решение понятное, но вопрос по эксплуатации/отказоустойчивости (SRE).
Для action-taking агента минимальный контроль = ОКО:
Owner: кто de jure владелец инцидента в проде (роль/должность/юрлицо)?
Kill-switch: где execution-layer emergency stop (circuit breaker), не в промпте?
Observability: какие сигналы/метрики детектят аномалию и триггерят стоп ДО ущерба?
Если чего-то из ОКО нет — это Uncontrolled (Defective), а не “autonomous”.

Эксперимент по подстройке Gemma 3 для вызова процедур