Разгружаем ученых: история разработки одного мультиагентного ИИ-ассистента для химиков / Хабр

Современная наука генерирует большие объемы данных, доступны значительные вычислительные мощности, но парадоксальным образом скорость научных открытий не растет пропорционально этим ресурсам. Основное ограничение ― человеческий ресурс. Количество высококвалифицированных научных сотрудников сильно отстает от масштаба исследований, которые технически можно проводить. Развитие искусственного интеллекта для науки пытается охватить полный цикл проведения научных исследований ― от формулировки новых исследовательских гипотез до реализации всех этапов их проверки. Возможность генерации новых научных идей и постановки гипотез звучит многообещающе, хотя пока сама по себе остается скорее научной гипотезой, которая требует исследования и проверки. Тем не менее, создание ИИ, который помогает ученым в повседневных задачах, уже становится реальностью.

Мы в исследовательском центре «Сильный искусств��нный интеллект в промышленности» ИТМО совместно с коллегами из Центра «ИИ в химии» решили проверить это на собственном опыте и занялись разработкой ИИ-ассистента ученого-химика, который позволит с использованием различных вычислительных инструментов и data-driven методов быстро и эффективно решать задачи, требующие построения цепочек рассуждений.

В основе нашей разработки ― большие языковые модели. Но мы не ограничивались ими и пошли по пути создания мультиагентной системы, которая значительно эффективнее универсальных языковых моделей при решении специализированных химических задач. Рассказываем, что у нас получилось.

Предыстория

Одна из ключевых задач в области химии ― поиск новых веществ и материалов, доработка уже известных и разработка новых методов синтеза. В этих областях последнее десятилетие существенные прорывы совершаются как раз с помощью искусственного интеллекта, потому что основаны они на огромном количестве накопленных данных.

Похожим образом обстоят дела в фармацевтической области. На данный момент в открытом доступе есть огромное количество данных о химических соединениях, их структуре и свойствах. И эти данные ― отправная точка для обучения и развития моделей искусственного интеллекта, который помогает продвигать направление дальше.

Однако ожидания от научного прогресса растут с каждым годом. Чтобы отрасль могла удовлетворить эти ожидания, нужно вложить огромное количество человеческого времени в процессы обработки накопленной информации. Часто это время тратят высококвалифицированные специалисты, которые занимаются узкими научными направлениями, но им приходится расходовать ресурсы на рутинную работу.

Мы считаем, что ускорить прогресс можно, переложив часть рутинной работы на искусственный интеллект. В химии такой рутиной может быть анализ и выявление закономерностей в данных, написание кода для автоматизации расчетов, поиск и суммаризация тематической информации из научных статей и других открытых источников и прочее.

Почему мультиагентность?

В мире постоянно предпринимают попытки обучить огромную модель ИИ, которая будет знать абсолютно всё обо всём. Но на практике у таких моделей есть две большие проблемы: эффективность с точки зрения используемых ресурсов и так называемое катастрофическое забывание. Когда большой модели пытаются «привить» новый узкий навык, она начинает забывать свои предыдущие возможности. Иными словами, большие языковые модели не могут достаточно эффективно уйти в узкую специализацию. С другой стороны, модели машинного обучения, которые создаются для специализированных задач, не способны хорошо обобщаться.

Чтобы собрать из двух этих «миров» все преимущества, мы в своей работе использовали мультиагентную систему. Вместо того, чтобы пытаться создать одну «всезнающую» модель, мы разрабатываем систему специализированных агентов, каждый из которых ― эксперт в своей области. Каждый агент имеет в своем ядре языковую модель, которая либо обучена, либо соответствующим образом проинструктирована, чтобы выполнять определенную роль. Над этими агентами есть некоторый оркестратор, который по сути распределяет задачи.

Такая реализация обеспечивает значительный скачок производительности относительно использования только большой языковой модели. Мы подтвердили это за счет сравнения с существующими дообученными для решения химических задач большими языковыми моделями: LlasMol, X-Lora-Gemma и ChemDFM.

Эти модели не справляются с узкоспециализированными задачами из-за отсутствия соответствующих инструментов, например, для генерации молекул. При этом отсутствие мультиагентности в виде дополнительных агентов для структурирования ответа также делает невозможным для этих моделей решение более сложных составных задач и правильный вывод результатов. При этом с точки зрения пользователя общение с системой ничем не отличается от взаимодействия с одной моделью ― он может даже не знать, что за интерфейсом языковой модели срывается несколько разных агентов.

Как решают похожие задачи в мире?

Несмотря на относительную новизну мультиагентного подхода на базе больших языковых моделей, сейчас уже есть множество подобных систем, но лишь несколько из них созданы для использования в научных исследованиях в таких областях, как химия. Стоит отметить мультиагентную систему ChemCrow, которая включает различные инструменты для работы с молекулярными соединениями и реакциями. Ее положительные стороны нашли отражение в еще одной, более современной системе ChemAgent.

Вот ее схема:

Несмотря на новизну и актуальность этих систем, ChemCrow и ChemAgent скорее показывают возможности мультиагентного подхода в химии и не являются инструментами, которые готовы к использованию в научных исследованиях. Причина ― в их ограниченности и частых ошибок в работе мультиагентной системы.

Создавая нашу систему, мы тщательно тестировали уже существующие решения, чтобы приблизиться к созданию востребованного для ученых проекта. Мы выбрали принципиально другой подход к созданию вспомогательных агентов и дали возможность основному агенту-оркестратору создавать план решения задач в запросе, который динамически изменяется по мере вызова инструментов. Это помогает системе более грамотно разбивать запросы на подзадачи, а также давать и выводить ответ для каждой из поставленных задач. Помимо этого, в нашей системе большинство инструментов мы разрабатывали сами с учетом их дальнейшего использования в системе, что позволило улучшить точность их ответов.

Текущая реализация

Как видно на схеме, система имеет иерархическую структуру с несколькими уровнями агентов:

На верхнем уровне находится Decomposer agent ― своего рода «диспетчер», который анализирует запросы пользователя и разбивает их на конкретные подзадачи.
Следующий уровень занимают Conductor agents ― оркестраторы, определяющие оптимальный набор инструментов для решения каждой подзадачи.
На нижнем уровне работают специализированные агенты двух типов:
- Агенты для работы с наноматериалами
- Агенты для работы с молекулами
Завершает цепочку Summary agent, который собирает результаты работы всех агентов и формирует понятный пользователю ответ.

Таким образом, пользователь может комбинировать задачи из разных подобластей химии и науки о материалах, а мультиагентная система сама будет планировать и реализовывать их выполнение, учитывая историю диалога и результаты применения различных инструментов.

Практические примеры

Давайте посмотрим на конкретный пример работы системы. Предположим, исследователю нужно разработать новое соединение для ингибирования определенного фермента. Как это выглядит на практике ― показываем ниже на рисунках.

На изображениях виден ход рассуждений системы при ответе на запрос пользователя, а также процесс вызова и получения ответов от различных инструментов:

Пользователь вводит запрос в систему через веб-интерфейс, например: Сгенерируй три ингибитора CYP3A4 и оцени их QED, липофильность и число карбоксильных групп.
Система анализирует запрос и определяет необходимые шаги.
Затем система предлагает наиболее подходящие молекулярные соединения.
Затем происходит конвертация названий соединений в нотацию SMILES (это представление молекул, часто используемое в машинном обучении).
После этого происходит расчет свойств, при этом в процессе система может изменить ход решения и посчитать некоторые свойства заново или предложить новые соединения, в зависимости от поставленной задачи.
Формирует финальный отчет с помощью агента суммаризатора, а также переводит его на язык, на котором общался пользователь.

Планы

В ближайшее время мы планируем существенно расширить возможности системы. Одна из больших задач ― анализ и извлечение знаний из научных статей.

Кроме того, мы видим большой потенциал в адаптации нашего подхода для других научных областей. Архитектура системы достаточно гибкая, чтобы ее можно было настроить для работы с данными из других дисциплин ― от биологии до материаловедения.

Наша конечная цель ― создать инструмент, который сделает научные исследования более эффективными, позволив ученым сосредоточиться на творческих аспектах их работы, пока ИИ берет на себя рутинные задачи анализа данных и поиска закономерностей.

ИИ-ассистент химика ChemCoScientist разработан на средства эндаумент-фонда ИТМО.

В 2025-2026 годах проект будет поддержан из средств программы «Приоритет 2030».

Разгружаем ученых: история разработки одного мультиагентного ИИ-ассистента для химиков

Предыстория

Почему мультиагентность?

Как решают похожие задачи в мире?

Практические примеры

Планы

Публикации

Информация