Соберите свою лабораторию ИИ-учёных: как freephdlabor превращает агентов в настоящую научную команду / Песочница / Хабр

Проблема: почему автоматизация науки до сих пор не взлетела?

За последние пару лет появилось множество систем, обещающих «полностью автоматизировать научное открытие»: от Sakana AI Scientist до Zochi и Robin. Но большинство из них работают по жёсткому сценарию:

Сгенерировать идею →
Запустить эксперимент →
Написать статью →
Отправить.

Если на шаге 2 эксперимент провалился, или на шаге 3 выяснилось, что идея была слабой — система всё равно идёт дальше. Это не наука, это конвейер. А настоящая наука — это итерации, ошибки, повороты и критическое переосмысление.

Кроме того, при долгих сессиях агенты теряют контекст: сообщения между ними превращаются в «испорченный телефон», где важные детали искажаются или теряются.

freephdlabor: архитектура, которая думает

freephdlabor — это попытка построить не конвейер, а живую исследовательскую группу из ИИ-агентов, каждый из которых — эксперт в своей области:

IdeationAgent — генерирует и уточняет гипотезы через arXiv и веб-поиск.
ExperimentationAgent — запускает эксперименты, строго следуя спецификации (и не пишет код вручную!).
ResourcePreparationAgent — «библиотекарь», который структурирует сотни файлов с результатами.
WriteupAgent — академический автор, пишущий статью в LaTeX.
ReviewerAgent — внутренний рецензент, который оценивает работу по 10-балльной шкале.

Но самое важное — над всеми ними стоит ManagerAgent, который играет роль руководителя лаборатории.

Как это работает на практике?

Вместо жёсткой последовательности шагов ManagerAgent анализирует результаты каждого агента и решает, что делать дальше:

Если ReviewerAgent поставил статье 5/10 — система не отправляет её вам, а возвращает на доработку.
Если WriteupAgent не может найти данные — ManagerAgent перезапускает ResourcePreparationAgent, чтобы исправить symlink.
Если эксперимент ничего не дал — система может вернуться к IdeationAgent и сгенерировать новую гипотезу.

Это динамический workflow, управляемый реальными данными, а не заранее прописанным сценарием.

Общая рабочая зона вместо «испорченного телефона»

Чтобы избежать потери информации при передаче данных между агентами, freephdlabor использует shared workspace — общую файловую систему.

Вместо того чтобы пересказывать результаты в текстовом сообщении («вот график, он показывает, что...»), агенты кладут файлы в workspace и просто ссылаются на них. Это:

исключает искажения,
сохраняет точность данных,
позволяет другим агентам повторно использовать артефакты без перегенерации.

Человек в цикле — без потери контроля

freephdlabor поддерживает асинхронное вмешательство человека: вы можете в любой момент:

остановить выполнение,
внести правки в файлы,
дать указание ManagerAgent’у,
даже сменить направление исследования.

При этом система сохраняет полную историю сессии, включая все промежуточные шаги, и позволяет продолжить завтра с того же места.

Пример из жизни: от идеи до принятой статьи

В демонстрационном запуске система:

Сгенерировала идею про HMM для детекции фаз обучения.
Провела базовые эксперименты.
Провалила подготовку ресурсов (не создала symlink).
Сама диагностировала проблему и перезапустила ResourcePreparationAgent.
Получила черновик статьи → ReviewerAgent поставил 5/10 → система расширила эксперименты (новые датасеты, аблейшн-стадии).
Переписала статью → получила 7/10 → завершила проект.

Всё это — без единого ручного вмешательства.

💡 Почему это важно для вас?

Open-source: код уже на GitHub — github.com/ltjed/freephdlabor.
Модульность: вы можете заменить RunExperimentTool на свой инструмент (например, для материаловедения или биохимии).
Plug-and-play: добавляйте/удаляйте агентов под свою задачу.
Долгосрочные исследования: память сохраняется между сессиями.

Это не «ещё один агент для написания статей». Это архитектурный фреймворк для создания собственного co-scientist’а, который растёт вместе с вашими задачами.

Что дальше?

Авторы видят freephdlabor как основу для персонализированных ИИ-лабораторий, доступных каждому исследователю — от PhD-студента до индустриального R&D. А с учётом трендов на агентные системы следующего поколения, такие фреймворки могут стать стандартом автоматизации науки.

А вы уже пробовали собрать свою команду ИИ-учёных?

P.S. Блог проекта: [freephdlabor.github.io]