
Anthropic опубликовала четвертый выпуск Anthropic Economic Index — на этот раз компания проанализировала 2 млн сессий Claude и ввела пять новых метрик для оценки экономического влияния ИИ. Один из ключевых выводов оказался неожиданным: модель преимущественно берет на себя высококвалифицированные задачи, а людям остается более простая работа.
Одна из ключевых находок касается связи между сложностью запроса и качеством ответа. Исследователи оценивали каждый диалог по двум параметрам: сколько лет формального образования нужно, чтобы понять запрос пользователя, и сколько — чтобы понять ответ Claude. Эти показатели коррелируют почти идеально (r > 0,92): если пользователь формулирует запрос на уровне выпускника университета, модель отвечает на том же уровне. Авторы исследования подчеркивают: то, как человек формулирует промпт, определяет, насколько глубоким будет ответ ИИ.
Это объясняет и другой парадокс: Claude ускоряет сложные задачи сильнее простых. Работа, требующая университетского образования, выполняется в 12 раз быстрее с помощью ИИ, тогда как задачи школьного уровня — только в 9 раз. Средняя задача в экономике требует около 13 лет образования, а задачи, с которыми обращаются к Claude — около 14 лет. Получается, что ИИ в первую очередь "забирает" именно квалифицированную работу.
Исследователи смоделировали, что ��роизойдет с профессиями, если исключить задачи, которые уже выполняет Claude. Для многих специальностей это означает деквалификацию: турагенты лишаются сложного планирования маршрутов и расчета стоимости поездок, а им остается выписывать билеты и принимать оплату. Технические писатели теряют аналитическую работу — анализ изменений в отрасли и рецензирование материалов. Впрочем, есть и обратные примеры: у управляющих недвижимостью ИИ берет на себя рутинные административные задачи — ведение записей о продажах и сверку арендных ставок с рынком, а людям достаются переговоры с архитектурными фирмами и встречи с советами директоров — то есть более сложные задачи.
При этом Anthropic отмечает важную оговорку: на сложных задачах Claude ошибается чаще. Успешность выполнения падает с 70% для простых запросов до 66% для задач университетского уровня. Для задач, которые у человека заняли бы 3,5 часа времени, модель справляется лишь в половине случаев. Это означает, что экспертиза человека для проверки результатов по-прежнему необходима — и именно здесь сохраняется ценность квалифицированных специалистов.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
