Обновить
0
Дари Ринч@DariRinch

Пользователь

1
Подписчики
Отправить сообщение

ИИ-агент сказал «сделано». Но сделал ли он на самом деле?

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели8.9K

На прошлой неделе Хабр опубликовал материал о том, как компании платят до 300 000 рублей в месяц за «скрытый аутсорс» задач в ChatGPT. История получила резонанс — но обсуждение ушло не туда. Говорили о доверии, об этике, о трудовом договоре.

Никто не спросил о главном: а как вы вообще проверяете, что задача была выполнена — агентом или человеком? И была ли она выполнена вообще?

В открытом демо-пайплайне dcl-eval-pipeline-demo я показала, как аудировать поведение агентов на практике. Теперь разберём, почему это критично и как построить полноценный слой верификации — вплоть до готового инструмента, который можно скачать и запустить прямо сейчас.

Это не риторический вопрос. Это архитектурная дыра, которая сейчас присутствует практически в каждой агентной системе. Называется она fabricated execution — ситуация, когда агент возвращает результат, не выполнив задачи, или выполнив что-то принципиально другое, оформив под видом запрошенного.

Что такое DCL?

Информация

В рейтинге
6 812-й
Откуда
Россия
Зарегистрирован
Активность

Специализация

AI Safety Researcher
Старший