AI-агенты, давайте сами. Как научить AI-агента искать информацию по базе, не задействуя датасеты

Что, если я скажу, что для обучения AI-агентов вам вообще не нужны датасеты? Не надо их собирать, валидировать, размечать. Достаточно развернуть двух агентов на компактной модели Qwen2.5-3B или 7B, запустить их где-нибудь у себя или в облаке, дать им базу знаний и наблюдать за циклом «AI учит сам себя», попивая кофеек :)
В середине января 2026 года на Hugging Face опубликовали исследование по фреймворку Dr. Zero (DeepResearch-Zero) для самообучения агентов (ссылка на GitHub там тоже имеется). Фишка: в этом подходе агенты самообучаются с нуля без участия человека и показывают результаты, сопоставимые с полностью контролируемыми поисковыми агентами. Для вашего удобства я написал обзор исследования и дополнил его пояснениями. Приглашаю почитать обо всем этом под катом.



















