vldmrmlkv 6 мая в 17:09

От MCP до мультиагентов: 10 Open Source AI проектов на GitHub и почему они важны

11 мин

6.5K

Искусственный интеллектПрограммирование*Open source*

Перевод

Группа экспертов GitHub провела анализ AI проектов, созданных за последние 99 дней, учитывая факторы, такие как количество звезд в день, форки, всплески трафика и активность контрибьюторов. Ниже мы расскажем вам об этих проектах и обсудим почему, по нашему мнению, они важны для AI разработки.

Содержание:

Для чего нужен протокол MCP?
Проект Open WebUI MCP: упрощение интеграции AI инструментов
Проект Unbody: “Supabase для AI”
Проект OWL: мультиагентное взаимодействие в действии
Проект F/mcptools: CLI для MCP разработчиков
Проект Nutlope/self.so: Создайте свой сайт с AI за считанные секунды
Проект VoiceStar: точное управление для приложений преобразования текста в речь
Проект Second-Me: создайте своего цифрового двойника
Проект SesameAILabs/csm: переосмысление синтеза речи
Проект Letta: универсальный стандарт для переносимых агентов ИИ
Проект Blender-MCP: соединение 3D-творчества и искусственного интеллекта
Выводы. Что эти проекты говорят нам об эволюции ИИ в открытом коде?

Для чего нужен протокол MCP?

MCP — это открытый протокол, который стандартизирует способы предоставления приложениями контекста для LLM. Представьте MCP как порт USB‑C для приложений ИИ. Так же как USB‑C обеспечивает стандартизированный способ подключения устройств к различным периферийным устройствам и аксессуарам, MCP обеспечивает стандартизированный способ подключения моделей ИИ к различным источникам данных и инструментам.
^{Источник:}^{https://docs.anthropic.com/en/docs/agents‑and‑tools/mcp}

Подробнее про MCP протокол

https://www.anthropic.com/news/model-context-protocol

https://docs.anthropic.com/en/docs/agents-and-tools/mcp

https://modelcontextprotocol.io/introduction

https://github.com/modelcontextprotocol

https://habr.com/ru/articles/879970/

https://habr.com/ru/articles/862312/

1. Проект Open WebUI MCP: упрощение интеграции AI инструментов

Ссылки

Сайт: https://docs.openwebui.com/

Репозиторий: https://github.com/open-webui/mcpo

ЯП: Python

Лицензия: MIT license

Это прокси‑сервер, который превращает инструменты MCP в OpenAPI‑совместимые HTTP‑серверы. ИИ разработчики используют этот сервер для простого соединения инструментов на базе MCP со всем, что использует стандартные RESTful OpenAPI‑интерфейсы.

Почему это важно:

«OpenWebUI (выпускник 2024 GitHub Accelerator) — отличный пример растущей тенденции в области ИИ, связанной с интеграцией, особенно с использованием MCP», — объясняет Эбигейл. «Это подчеркивает, что людям в ИИ нужно больше интеграции и такие стандарты как MCP могут в этом помочь».

2. Проект Unbody: “Supabase для AI”

Ссылки

Сайт: https://unbody.io/

Репозиторий: https://github.com/unbody-io/unbody

ЯП: TypeScript

Лицензия: Apache 2.0 license

Unbody это Supabase, но для искусственного интеллекта. Это модульный бэкенд, позволяющий создавать программное обеспечение, ориентированное на ИИ, которое действительно понимает и осмысливает, а не просто перемешивает данные.
Проект разбивает всё на четыре уровня, которые можно смешивать и сочетать:

Восприятие: Получает, анализирует, улучшает и векторизует исходные данные.
Память: Хранит структурированные знания в векторных базах данных и постоянных хранилищах.
Рассуждение: Генерирует содержание, вызывает функции и планирует действия.
Действие: Предоставляет знания через API, SDK и триггеры.

Почему это важно:

«Это интересный вопрос: Как программирование агентов может стать более абстрагированным от бэкенда?» — спрашивает Кевин. «С Unbody вы можете писать на любом фреймворке и получить бэкэнд, который будет автоматически управляться. Если вы посмотрите на такие компании, как E2E, то увидите, что ведётся работа по созданию гораздо более продвинутых агентов, которые показывают, как абстрагируется стек бэкенда».

3. Проект OWL: мультиагентное взаимодействие

Ссылки

Репозиторий: https://github.com/camel-ai/owl

ЯП: Python

Лицензия: Apache 2.0 license

Когда одного агента ИИ становится недостаточно — в дело вступает OWL! Построенный на базе фреймворка CAMEL‑AI, который наиболее известен тем, что популяризировал ролевой подход для мультиагентных систем и выпустил множество синтетических пакетов «задача + данные», OWL позволяет нескольким специализированным агентам взаимодействовать через браузеры, терминалы, вызовы функций и инструменты MCP. OWL даже возглавляет список лидеров с открытым исходным кодом в бенчмарке GAIA (58.18).

Почему это важно:

«Это не просто агенты, это еще и мультимодельные и мультиагентные архитектуры», — отмечает Эбигейл. «Год назад речь шла о людях, создающих модели, а теперь речь идет об агентах и о том, что они могут делать. OWL занимается мультиагентной работой, которая быстро развивается».

4. Проект F/mcptools: CLI для MCP разработчиков

Ссылки

Репозиторий: https://github.com/f/mcptools

ЯП: Go

Лицензия: MIT license

Поклонники CLI: перед вами интерфейс командной строки для работы с серверами MCP. Созданный звездой GitHub Фатихом Кадиром Акином (который также создал функцию подсказок GitHub Copilot), он позволяет вам находить и вызывать инструменты, получать доступ к ресурсам и управлять подсказками с любого MCP‑совместимого сервера.

MCP Tools поддерживает ввод/вывод данных через stdin/stdout или HTTP и выдает результаты в виде JSON или таблиц. Он даже позволяет создавать макеты серверов для тестирования или передавать MCP‑запросы сценариям оболочки.

Почему это важно:

Это превращает MCP в нечто, что можно «git clone && mcp call». Он предлагает привычный рабочий процесс CLI плюс встроенный режим безопасности, позволяющий быстро создавать прототипы инструментов и блокировать их для продакшена.

5. Проект Nutlope/self.so: создайте свой сайт за считанные секунды

Ссылки

Сайт: https://www.self.so/EB

Репозиторий: https://github.com/Nutlope/self.so

ЯП: TypeScript

Лицензия: MIT license

Если создание личного сайта — не самое приятное занятие, Nutlope/self.so вам поможет. Загрузите своё резюме или профиль LinkedIn, и инструмент создаст для вас простой сайт, используя искусственный интеллект для вёрстки, без головной боли с CSS.

Технологический стек включает Together.ai для языкового моделирования, Vercel's AI SDK, Clerk для аутентификации, Next.js для фреймворка, Helicone для наблюдаемости, S3 для хранения, Upstash Redis для базы данных и Vercel для хостинга.

Почему это важно:

Проект представляет собой сборный «ИИ‑конструктор Lego». Это потому, что он объединяет Vercel AI SDK, Clerk auth, Upstash Redis, S3 и Tailwind, причем каждый сервис выполняет одну задачу, что иллюстрирует, как современные приложения для ИИ часто собираются из небольших сервисов, а не монолитов.

6. Проект VoiceStar: точное управление для TTS приложений

Ссылки

Репозиторий: https://github.com/jasonppy/VoiceStar

ЯП: Python

Лицензия: MIT code license, CC-BY-4.0 model license

Если в вашем проекте требуется речь, которая должна укладываться в определенный временной промежуток — вам поможет VoiceStar с регулировкой длительности. Он позволяет разработчикам устанавливать нужную длительность, чтобы голосовой вывод соответствовал чувствительным ко времени сценариям использования — например, подсказкам фиксированной длины или повествованию — без дополнительного редактирования звука.

Проект включает в себя интерфейсы CLI и Gradio для вывода, а также предварительно обученные модели, которые можно использовать сразу же. Поскольку голосовые интерфейсы становятся всё более важными в приложениях, наличие моделей с открытым исходным кодом и таким уровнем контроля — полезный шаг вперёд.

Почему это важно:

Это открытая модель TTS, позволяющая привязать речь к точной длительности, что полезно для дубляжа, рекламы и наложений, где важна каждая миллисекунда. Это ИИ, поддерживающий вещательный уровень синхронизации, от ИИ сообщества с открытым исходным кодом.

7. Проект Second-Me: создайте своего цифрового двойника

Ссылки

Сайт: https://www.secondme.io/

Репозиторий: https://github.com/mindverse/Second-Me

ЯП: Python

Лицензия: Apache 2.0 license

Хотите поэкспериментировать с искусственным интеллектом? Second‑Me позволяет вам попробовать создать базового «цифрового двойника» — агента, который будет отражать некоторые ваши знания, стиль общения и предпочтения.

Возможности могут быть самыми разными: от персональных помощников, которые действительно понимают, как вы думаете, до инновационных способов поделиться своим опытом с другими. Один из примеров применения Second‑Me в действии: ваш цифровой двойник управляет вашим аккаунтом на LinkedIn или Airbnb, играя роль специалиста или хозяина квартиры.

Почему это важно:

Это яркий пример того, что мы наблюдаем переход от моделей к агентам. «Если посмотреть на ситуацию год назад, то всё сводилось к созданию моделей. Как сделать X или Y? Вы создавали новую модель», — объясняет Джефф. «Этот проект и другие демонстрируют сдвиг в сторону агентных движений и того, как люди используют ИИ для выполнения задач».

8. Проект SesameAILabs/csm: переосмысление синтеза речи

Ссылки

Репозиторий: https://github.com/SesameAILabs/csm

ЯП: Python

Лицензия: Apache 2.0 code license (model has restrictions on Abuse)

Conversational Speech Model (CSM) предлагает новый подход к генерации речи. Она преобразует текстовые и аудиоданные в аудиокоды с остаточной векторной квантизацией (RVQ), используя архитектуру на основе Llama. Его специальный аудиодекодер производит аудиокоды Mimi, в результате чего получается удивительно естественно звучащая речь.

Интересно то, как CSM объединяет архитектуру языковой модели и специализированный аудиодекодер, предоставляя вам открытую альтернативу проприетарным вариантам преобразования текста в речь, которые доминируют на рынке.

Почему это важно:

CSM объединяет текстовую основу на базе Llama с легким аудиодекодером, который выводит коды Mimi RVQ — это доказывает, что мультимодальные мэшапы могут работать локально на одном GPU. Это говорит о том, что мультимодальность на уровне моделей начинает приобретать API‑цепочки, а лицензирование Apache-2.0 ускоряет исследования и разработки сообщества по созданию речевых систем с миллиардом параметров.

9. Проект Letta: универсальный стандарт для переносимых агентов ИИ

Ссылки

Репозиторий: https://github.com/letta-ai/agent-file

ЯП: Python

Лицензия: Apache 2.0 license

Letta представляет открытый формат файлов (.af) для упаковки агентов ИИ с сохранением их памяти и поведения. Считайте, что это переносимый контейнер для агентов. Вы можете обмениваться ими, ставить контрольные точки и контролировать версии в разных фреймворках.

Для разработчиков, использующих разные фреймоворки агентов, это может стать экономией времени. Хотите перенести агента с одной системы на другую, не перестраивая его с нуля? Именно эту проблему решает Letta.

Примечательно, что проект Letta является ответвлением от проекта cpacker/memgpt — он выделил слой сериализации, который MemGPT первоначально использовал для привязки своих «виртуально‑контекстных» агентов. Команда вырезала этот код в чистую, не зависящую от фреймворка спецификацию (agent‑file), так что любой стек — MemGPT/Letta, LangGraph, CrewAI — может импортировать или экспортировать полностью stateful агента с помощью одного архива.af.

Почему это важно:

Подумайте о «Docker‑образе для агентов ИИ». В.af‑образе хранятся снимки памяти, инструменты и подсказки, позволяющие контролировать версии, обмениваться и производить горячую замену агентов между фреймворками (MemGPT, LangGraph, CrewAI и т. д.), что решает проблему «как мне переместить моего агента?».

10. Проект Blender-MCP: соединение 3D и искусственного интеллекта

Ссылки

Репозиторий: https://github.com/ahujasid/blender-mcp

ЯП: Python

Лицензия: MIT license

Художники Blender, это для вас: Blender‑MCP это инструмент, который соединяет популярный пакет для создания 3D с открытым исходным кодом Blender с искусственным интеллектом Claude AI через MCP. С помощью Blender‑MCP разработчики могут управлять операциями Blender с помощью естественного языка или добавить помощь искусственного интеллекта в свой рабочий процесс 3D.

Blender‑MCP показывает, как MCP может выступать в качестве универсального «порта инструментов» для LLM‑агентов: сегодня это Blender, а завтра — Unity, Unreal или любое сложное настольное приложение. Для 3D‑художников и прототипировщиков это означает более быстрое блокирование сцен, лёгкие эксперименты со стилями и совершенно новый способ обучения новичков. Просто опишите, что вы хотите, и смотрите, как программа создает это.

Почему это важно:

Это показывает, как MCP может подключить LLM к тяжелым настольным приложениям — в данном случае, давая Claude ключи к Blender для создания сцен на естественном языке и управления ассетами. Его быстрый рост намекает на то, что следующий скачок UX в 3D (и, возможно, в CAD, Unity, Unreal) может быть в переходе на работу с AI агентами.

Выводы. Что эти проекты говорят нам об эволюции ИИ в open source?

Эти проекты не только отражают текущее состояние ИИ в open source, но также намекают на проблемы и возможности, которые ждут нас впереди. Вот что говорят эксперты GitHub:

1. Интеграция в ИИ через MCP - это новый рубеж

Широкое распространение MCP во многих проектах подчеркивает растущую важность стандартизированных патернов интеграции в разработке ИИ.

«Я увидела одну общую проблему — интеграции ИИ», — отмечает Эбигейл. «Больше стандартов, таких как MCP, помогут в этом».

2. Мультиагентность

Такие проекты, как OWL, указывают на будущее, в котором несколько специализированных агентов ИИ будут работать вместе для решения сложных задач.

«Вы должны думать об этом в контексте взаимодействия человека с человеком, агента с агентом, а затем иметь несколько агентов, работающих в тандеме», — объясняет Кевин, подчеркивая сложность и потенциал такого подхода.

3. Генерация речи развивается

Речевые технологии, конечно, не новы, но большие языковые модели настолько сильно меняют преобразование текста в речь (TTS) и речи в текст (STT), что открывается новая волна возможностей.

Это может иметь влияние на СМИ, поддержки клиентов и UX продуктов.

4. Меняющийся ландшафт участия в проекте с открытым исходным кодом

ИИ привлек к open source коду новую волну контрибьюторов и разработчиков проектов, которые привнесли новую энергию и подходы.

Кара Делосс, старший менеджер программы по связям с разработчиками в GitHub, отмечает: «Мы видим новое поколение или новый тип контрибьюторов в сфере ИИ». Кевин добавляет, что «если у вас есть большое сообщество в первый день, это очень ценно», подчеркивая, как развивается экосистема. Это сочетание устоявшихся и новых методов разработки создает захватывающие возможности для сотрудничества в рамках сообщества.

5. Важность лицензий, одобренных OSI

Каждый топовый проект в нашем списке использует лицензии, одобренные OSI (в основном MIT и Apache 2.0), и это не случайно. «В общем, вы не получите много положительных отзывов от сообщества, если будете называть себя open source проектов и не будете использовать лицензию, одобренную OSI», — отмечает Джефф. «Эти лицензии важны, потому что они предоставляют четкие гарантии прав на использование, модификацию и перераспределение, что укрепляет доверие в сообществе».

Джефф также отмечает возникающую проблему: «По мере того как сервисы и инструменты на базе ИИ становятся все более мощными, мы наблюдаем тенденцию, когда некоторые проекты накладывают ограничения на использование модели или сервиса, связанные со злоупотреблениями и мошенничеством. Это может повлиять на открытость лицензии проекта, одобренной OSI, и проекты и сообщество будут продолжать активно обсуждать эти условия».

Джефф добавляет: «Важно понимать и документировать все существующие ограничения, прежде чем использовать модель или сервис».

6. Изучайте и вносите свой вклад в создание инструментов ИИ завтрашнего дня!

Проекты, о которых мы рассказали здесь, — это лишь верхушка айсберга. Поскольку ИИ продолжает развиваться, экосистема с открытым исходным кодом — это место, где первыми появляются многие из самых интересных стандартов, инструментов и методов.

Эксперты принявшие участия в данном обзоре

Эбигейл Кабунок Майес (Abigail Cabunoc Mayes), она же @abbycabs, которая работает над программами сопровождения открытого кода и занимает должность директора в фонде OpenJS.
Кара Соулс, она же @karasowles, которая работает с сопровождающими и сообществом разработчиков открытого кода
Кевин Кросби (Kevin Crosby), он же @kevincrosby, руководит программой GitHub по финансированию открытых исходников
Джефф Лущ (Jeff Luszcz), он же @jeffrey-luszcz, который помогает управлять программным офисом GitHub по работе с открытым исходным кодом (OSPO).

Если вы нашли ошибку, опечатку или у вас есть замечание по переводу — используйте, пожалуйста, Ctrl+Enter.

Хабы:

От MCP до мультиагентов: 10 Open Source AI проектов на GitHub и почему они важны

Для чего нужен протокол MCP?

1. Проект Open WebUI MCP: упрощение интеграции AI инструментов

2. Проект Unbody: “Supabase для AI”

3. Проект OWL: мультиагентное взаимодействие

4. Проект F/mcptools: CLI для MCP разработчиков

5. Проект Nutlope/self.so: создайте свой сайт за считанные секунды

6. Проект VoiceStar: точное управление для TTS приложений

7. Проект Second-Me: создайте своего цифрового двойника

8. Проект SesameAILabs/csm: переосмысление синтеза речи

9. Проект Letta: универсальный стандарт для переносимых агентов ИИ

10. Проект Blender-MCP: соединение 3D и искусственного интеллекта

Выводы. Что эти проекты говорят нам об эволюции ИИ в open source?

1. Интеграция в ИИ через MCP - это новый рубеж

2. Мультиагентность

3. Генерация речи развивается

4. Меняющийся ландшафт участия в проекте с открытым исходным кодом

5. Важность лицензий, одобренных OSI

6. Изучайте и вносите свой вклад в создание инструментов ИИ завтрашнего дня!

Публикации

Ближайшие события