mefdayy 18 апр в 13:38

Open Deep Research: инструмент для многоэтапных веб-исследований от Together AI

3 мин

Блог компании BotHubИскусственный интеллектМашинное обучение*

Компания Together AI представила Open Deep Research — инструмент с открытым исходным кодом, предназначенный для поиска ответов на сложные вопросы с помощью структурированных многоэтапных веб-исследований.

Фреймворк основан на концепции, изначально предложенной OpenAI, но использует более прозрачный подход: его код, наборы данных и архитектура системы полностью открыты для общественности.

В отличие от обычных поисковых систем, которые выдают список ссылок и требуют от пользователей самостоятельного поиска нужной информации, Open Deep Research генерирует структурированные отчёты с цитатами.

Другие компании выпустили аналогичные инструменты. Google, Grok и Perplexity предлагают функции для глубокого анализа. Anthropic недавно представила функцию анализа на основе агентов для своей модели Claude. Вскоре после выпуска системы OpenAI Hugging Face анонсировала собственную альтернативу с открытым исходным кодом, но не продолжила её разработку.

В Open Deep Research используется четырёхэтапный процесс. Сначала модель планирования генерирует список релевантных запросов, которые затем используются для сбора контента с помощью поискового API Tavily. Модель проверки выявляет пробелы в знаниях, после чего модель написания текста составляет итоговый отчёт.

Итеративный процесс глубокого исследования сочетает в себе систематическое планирование с постоянным самоанализом. Благодаря повторяющимся циклам поиска и оценки информация собирается и уточняется до тех пор, пока не будет получен полный ответ.

Для обработки длинных документов дополнительная модель обобщения сжимает контент и оценивает его релевантность. Этот шаг предназначен для того, чтобы крупные языковые модели не превышали ограничения по контекстному окну.

Архитектура системы включает специализированные модели от Alibaba, Meta* и DeepSeek. Qwen2.5-72B отвечает за этап планирования, а Llama-3.3-70B обобщает контент. Llama-3.1-70B извлекает структурированные данные, а DeepSeek-V3 пишет итоговый отчёт. Все компоненты размещены в частной облачной инфраструктуре Together AI.

Окончательные результаты форматируются в формате HTML и включают как текстовые, так и визуальные элементы. Система использует библиотеку JavaScript Mermaid JS для создания диаграмм и автоматически генерирует обложки с помощью моделей Flux от Black Forest Labs.

Платформа также поддерживает режим подкаста, в котором кратко излагается содержание отчёта. Эта функция основана на голосовых моделях Cartesia Sonic.

Производительность оценивалась с помощью трёх тестов: FRAMES (многоэтапное рассуждение), SimpleQA (фактические знания) и HotPotQA (многоэтапные вопросы). Во всех трёх случаях Open Deep Research превзошёл базовые модели, которые не используют инструменты поиска. Система также показала более высокое качество ответов, чем Open Deep Research (LDR) от LangChain и SmolAgents (SearchCodeAgent) от Hugging Face.

У Together AI производительность всех протестированных моделей выше, чем у альтернативных решений.

Согласно результатам тестирования, несколько циклов поиска значительно повысили точность. Когда система была ограничена одной итерацией поиска, производительность снизилась.

Несмотря на улучшения, некоторые фундаментальные недостатки остаются. Как отмечает Together AI, «ошибки на ранних этапах могут распространяться по всей цепочке». Система также подвержена галлюцинациям, особенно при интерпретации неоднозначных или противоречивых источников.

Структурные искажения в обучающих данных или поисковых индексах также могут влиять на результаты. Особенно уязвимы темы с ограниченным охватом или требующие информации в реальном времени, например, прямые трансляции. Хотя кэширование может снизить затраты, Together AI предупреждает, что оно может привести к предоставлению устаревшей информации, если не установлена политика истечения срока действия.

Компания Together AI заявляет, что выпуск предназначен для создания открытой платформы для дальнейших экспериментов и улучшений. Архитектура спроектирована как модульная и расширяемая, что позволяет разработчикам интегрировать собственные модели, настраивать источники данных или добавлять новые форматы вывода. Весь код и документация доступны в открытом доступе на GitHub.

Ранее компания выпустила модель с открытым исходным кодом, которая по производительности приближается к o3-mini от OpenAI, но имеет значительно меньше параметров.

*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации

Источник

Теги:

Хабы:

Open Deep Research: инструмент для многоэтапных веб-исследований от Together AI

Другие новости

Информация