Проблема: почему автоматизация науки до сих пор не взлетела?

За последние пару лет появилось множество систем, обещающих «полностью автоматизировать научное открытие»: от Sakana AI Scientist до Zochi и Robin. Но большинство из них работают по жёсткому сценарию:

  1. Сгенерировать идею →

  2. Запустить эксперимент →

  3. Написать статью →

  4. Отправить.

Если на шаге 2 эксперимент провалился, или на шаге 3 выяснилось, что идея была слабой — система всё равно идёт дальше. Это не наука, это конвейер. А настоящая наука — это итерации, ошибки, повороты и критическое переосмысление.

Кроме того, при долгих сессиях агенты теряют контекст: сообщения между ними превращаются в «испорченный телефон», где важные детали искажаются или теряются.

freephdlabor: архитектура, которая думает

freephdlabor — это попытка построить не конвейер, а живую исследовательскую группу из ИИ-агентов, каждый из которых — эксперт в своей области:

  • IdeationAgent — генерирует и уточняет гипотезы через arXiv и веб-поиск.

  • ExperimentationAgent — запускает эксперименты, строго следуя спецификации (и не пишет код вручную!).

  • ResourcePreparationAgent — «библиотекарь», который структурирует сотни файлов с результатами.

  • WriteupAgent — академический автор, пишущий статью в LaTeX.

  • ReviewerAgent — внутренний рецензент, который оценивает работу по 10-балльной шкале.

Но самое важное — над всеми ними стоит ManagerAgent, который играет роль руководителя лаборатории.

Как это работает на практике?

Вместо жёсткой последовательности шагов ManagerAgent анализирует результаты каждого агента и решает, что делать дальше:

  • Если ReviewerAgent поставил статье 5/10 — система не отправляет её вам, а возвращает на доработку.

  • Если WriteupAgent не может найти данные — ManagerAgent перезапускает ResourcePreparationAgent, чтобы исправить symlink.

  • Если эксперимент ничего не дал — система может вернуться к IdeationAgent и сгенерировать новую гипотезу.

Это динамический workflow, управляемый реальными данными, а не заранее прописанным сценарием.

Общая рабочая зона вместо «испорченного телефона»

Чтобы избежать потери информации при передаче данных между агентами, freephdlabor использует shared workspace — общую файловую систему.

Вместо того чтобы пересказывать результаты в текстовом сообщении («вот график, он показывает, что...»), агенты кладут файлы в workspace и просто ссылаются на них. Это:

  • исключает искажения,

  • сохраняет точность данных,

  • позволяет другим агентам повторно использовать артефакты без перегенерации.

Человек в цикле — без потери контроля

freephdlabor поддерживает асинхронное вмешательство человека: вы можете в любой момент:

  • остановить выполнение,

  • внести правки в файлы,

  • дать указание ManagerAgent’у,

  • даже сменить направление исследования.

При этом система сохраняет полную историю сессии, включая все промежуточные шаги, и позволяет продолжить завтра с того же места.

Пример из жизни: от идеи до принятой статьи

В демонстрационном запуске система:

  1. Сгенерировала идею про HMM для детекции фаз обучения.

  2. Провела базовые эксперименты.

  3. Провалила подготовку ресурсов (не создала symlink).

  4. Сама диагностировала проблему и перезапустила ResourcePreparationAgent.

  5. Получила черновик статьи → ReviewerAgent поставил 5/10 → система расширила эксперименты (новые датасеты, аблейшн-стадии).

  6. Переписала статью → получила 7/10 → завершила проект.

Всё это — без единого ручного вмешательства.

💡 Почему это важно для вас?

  • Open-source: код уже на GitHub — github.com/ltjed/freephdlabor.

  • Модульность: вы можете заменить RunExperimentTool на свой инструмент (например, для материаловедения или биохимии).

  • Plug-and-play: добавляйте/удаляйте агентов под свою задачу.

  • Долгосрочные исследования: память сохраняется между сессиями.

Это не «ещё один агент для написания статей». Это архитектурный фреймворк для создания собственного co-scientist’а, который растёт вместе с вашими задачами.

Что дальше?

Авторы видят freephdlabor как основу для персонализированных ИИ-лабораторий, доступных каждому исследователю — от PhD-студента до индустриального R&D. А с учётом трендов на агентные системы следующего поколения, такие фреймворки могут стать стандартом автоматизации науки.

А вы уже пробовали собрать свою команду ИИ-учёных?

P.S. Блог проекта: [freephdlabor.github.io]