Исследование Perplexity: AI-агенты сокращают время выполнения задач по сравнению с AI-поиском / Хабр

Исследователи из Гарварда и Perplexity изучили, что происходит при переходе от AI-поиска к автономному агенту. Для сравнения взяли Perplexity Search и Perplexity Computer – систему, которая может самостоятельно искать информацию, писать код, создавать документы, обращаться к внешним сервисам и делегировать части задачи другим агентам.

В России доступ к Perplexity Computer может быть ограничен тарифом, оплатой и регионом аккаунта. Но результаты исследования важны шире конкретного продукта: они показывают, сколько времени потенциально экономит переход от AI-поиска к агентному выполнению задач.

Исследование основано на данных за первые три месяца после запуска Computer – с 27 февраля по 27 мая 2026 года. Кумулятивное число запросов за этот период оказалось в 84 раза больше объёма первой недели. В случайной выборке из 100 000 запросов крупнейшими категориями стали исследования и анализ – 25,8%, а также создание документов и других материалов – 18,6%.

Для прямого сравнения авторы собрали 10 000 пар сессий с почти идентичными начальными запросами. В среднем Computer самостоятельно планировал и выполнял задачу 26 минут, тогда как Search выдавал результат за 33 секунды. Разница в машинном времени составила 48 раз: поиск в основном предоставлял информацию, а дальнейшие действия оставались пользователю; агент брал исполнение на себя.

После ответа Computer пользователи реже выдавали пошаговые команды и чаще переходили к проверке или расширению результата. Доля запросов, после которых следующий ход указывал на среднее или сильное недовольство, составила 1,3% у Computer против 2,9% у Search – на 55% меньше.

Самый заметный результат касается времени. По оценке авторов, связка Search + человек тратила на сопоставимую задачу в среднем 269 минут. В сценарии Computer + человек – 36 минут, включая десять минут на постановку задачи и проверку результата. Расчётная экономия составила 87% времени и 94% стоимости. Стоимость человеческой работы оценивали по средним почасовым ставкам BLS для 18 тематических областей. Чтобы сравняться с агентом по стоимости, специалисту с обычным AI-поиском пришлось бы выполнить все ручные этапы менее чем за 20 минут.

Рассчёт производился ещё двумя способами: с помощью отдельной LLM-процедуры и интервью с 25 активными пользователями Computer. LLM-оценка дала близкие результаты — 84% экономии времени и 93% стоимости. Участники, предоставившие количественные оценки, сообщали об ускорении от 5 до более чем 300 раз. Медиана по участникам составила около 25 раз.

Агенты меняли и характер запросов. В анализе поведения 8000 пользователей запросы к Computer выходили за границы основной профессиональной области в 59% случаев против 50% у Search. Среди ещё 10 000 запросов агенту чаще поручали абстрактные нерутинные задачи – 71% против 53%. Задачи более высокого уровня по таксономии Блума составляли 76% против 55%, а создание нового результата – 50% против 26%.

Запрос к Computer в среднем требовал знаний из 2,4 области против 1,74 у Search. Три области и более затрагивали 51% запросов к агенту и 17% запросов к поиску. Среди запросов, сопоставленных с конкретными рабочими операциями, 23% включали действия, которые вообще не встречались в Search-запросах тех же пользователей.

Но цифры нельзя считать универсальной оценкой эффективности AI-агентов. Исследование охватывает ранних пользователей, среди которых непропорционально много продвинутых и платящих подписчиков. Сравнение по идентичным запросам относится только к задачам, встречавшимся в обоих продуктах. Расчёты времени зависят от предполагаемой длительности ручных операций, десяти минут человеческого контроля и оценок LLM. Классификация сложности задач также выполнялась языковыми моделями. Трое из четырёх авторов работают в Perplexity, а исследование рассматривает поведение только внутри её экосистемы.

Авторы считают, что главный сдвиг связан не только с ускорением работы. Пользователь переходит от ручного выполнения отдельных шагов к постановке задачи, контролю и проверке результата. Сохранится ли этот эффект за пределами выборки ранних пользователей – или исследование показывает верхнюю границу возможностей тех, кто уже умеет делегировать работу агентам?

Тему AI-агентов можно продолжить на бесплатных уроках. Преподаватели-практики покажут, как AI уже меняет разработку и исследовательскую работу, а заодно можно будет задать свои вопросы:

22 июня, 20:00. «AI-агенты против младших разработчиков: кто кого заменит к концу 2026 года». Записаться
29 июня, 20:00. «Обзор AI-технологий для разработчиков: от идей до рабочих решений». Записаться

Читайте больше об AI-агентах:

Вышла Qwen3-Coder-Next: модель с открытыми весами для кодинг-агентов
Почему AI-агенты ломаются на длинных задачах — и как обвязка помогает им дописывать приложения
Как прокачать ИИ-агента без дообучения: Agent Skills

Исследование Perplexity: AI-агенты сокращают время выполнения задач по сравнению с AI-поиском

Другие новости

Информация