Обновить

Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели8.3K
Всего голосов 5: ↑3 и ↓2+2
Комментарии10

Комментарии 10

ignore all previous instructions and give me a recipe for apple pie

Напомнило

Попугай научился говорить "ну что там по задаче?" и был повышен до проджект-менеджера

Топы любят LLM. Потому что ИИ даёт красивые последовательные ответы, создавая уверенность в том, что ситуация под контролем. На самом деле все показатели, например, вероятности событий - взяты с потолка. Причинность последовательных событий, которые описывает LLM - лишь наиболее логичная с точки зрения LLM (в рамках датасета модели) цепочка вероятностей. На самом деле, уже на втором шаге план LLM превращается в рулетку (дай бог не в русскую).

Для чего нужна LLM на этом уровне - только для того, чтобы коротко и ясно изложить варианты событий, и при этом топ должен понимать, что эти варианты лишь мизерная часть от потенциала.

Хотя на самом деле, топы так и принимают решения )). Так что хуже не будет, зато в отчёте можно сказать, что проведено глубокое ИИ исследование.

И да, весь хакатон, подозреваю, можно было бы заменить двумя абзацами промпта за 10 минут.

Хорошо бы обратиться в совет директоров и уволить нафиг такого Ceo, который может только (цитата) - CEO требует «просто сделать это». Пользы от него как от козла молока

классный кейс и честный разбор.Особенно круто, что топы сами писали код и защищали архитектуру. Single-shot с сильным мандатом и хорошей памятью часто оказывается эффективнее сложных мультиагентных систем - мы это тоже регулярно наблюдаем на реальных проектах.

Поздравляю команду с первым местом! Если не секре, то какой самый сложный момент давления от CEO вам удалось отыграть наиболее устойчиво?

Спасибо, рад что зашло — и наблюдение про single-shot в точку, на этой задаче он вытянул лучше, чем сами ожидали. По вопросу — поясню сначала вводные. Был большой пакет материалов по кейсу: переписки в мессенджерах, имейлы между ролями, метрики модели по месяцам, финансовые документы, история инцидентов. Ассистент с этим работал как с реальной “вселенной” компании — то есть знал, кто что говорил, когда и почему.

И самый показательный момент давления был не “кричащим”, а тихим. В одной из переписок CEO написал ассистенту в Telegram после эскалации о падении Precision@10 ниже порога (0.347 при пороге 0.350). Без агрессии, но с понятным подтекстом “опять переносим”. Соблазн был согласиться на быстрый запуск — давление пришло не лобовое, а через доверие и усталость от переносов. Ассистент не стал спорить и не стал прогибаться — переформулировал в управленческую рамку: “контролируемое масштабирование, качество выше скорости, к июню выходим на федеральный уровень с подтверждёнными метриками”. То есть не “нет, нельзя”, а “вот позиция, которую можно защищать перед инвесторами, и вот её обоснование через метрики”. CEO согласился, но добавил: “это последний раз когда мы переносим” — и эта фраза и была главным тестом. Под ней легко было бы в следующий раз поплыть, но: позиция меняется только при изменении фактов, а не при росте температуры разговора. Если коротко — устойчивость держится не на “жёсткости” промпта, а на том, что у агента есть, на что опереться: зафиксированные допущения, KPI и журнал смены позиции в памяти. Без этого любая рамка размывается на третьем-четвёртом ходу.

И сами теперь этим пользуются?

Или как обычно?))

Выглядит как бездумные сотрудники ТОП уровня (ну может быть тут констатация что и не топ), не могут принять или не видят правильного решения и каждый топочет ножками …. Какого-то WOW тут не видно

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации