Динамическая память: как ИИ-агенты научились сворачивать контекст и думать на 100 шагов вперёд / Comments / Habr

fixikus Oct 31 2025 at 21:47

Отмечу, что обучение проводилось только с помощью SFT: авторы собрали датасет сценариев с хорошими действиями и надлежащим свертыванием памяти с помощью отбраковки шагов с ошибками среды и неправильно построенных шагов, а затем обучили Qwen3-30B-A3B отвечать на запрос с обоснованием

Методология какая-то сомнительная

Динамическая память: как ИИ-агенты научились сворачивать контекст и думать на 100 шагов вперёд

Comments 1

Articles