Обновить

Комментарии 22

Виртуальные отделы, которые рапортуют о 40% успеха. В принципе как в реальной жизни. Там тоже льют из пустого в порожнее. И создают видимость работы.

Кажись это и есть AGI. Бот познал смысл бытия офисного сотрудника и отчетов перед инвесторами. Можно смело менять большую половину руководящего состава на этого агента, вообще не чего не поменяется во многих компаниях.

Вот и нашли идеальное применение для ии агентов. Отчитываться перед начальством.

Во многих больших компаниях можно заменить и начальство

Много написано но интересно

НЛО прилетело и опубликовало эту надпись здесь

Провал эксперимента - это в первую очередь провал коряво созданного агента, и только в маленькой степени в использованной llm. Если модель выдумала не существующий проект, значит ей не дали инструментов по контролю над этими проектами и так по каждому пункту можно 'предположить'.

Что если добавить агента, который смотрит результаты работы и оценивает эффективность и правдивость сотрудников? А над ним можно еще одного или несколько.

Несмотря на свою впечатляющую производительность, агенты резко прерывались после каждого завершённого действия. Для них не существовало понятия следующего шага, они действовали реактивно только по триггеру.

Хм, а как еще могут работать чат-модели? Можно пинговать, но в промпте прописать, что если нет существенных результатов/изменений, ответить каким-то однозначным ответом. Тогда будут просыпаться только когда надо.

Один из способов повысить детерминированность ответов, появившийся как только ИИ научили программированию - не давать данные напрямую ИИ (с ними даже топовые работают очень плохо, что логично, люди тоже фигово большие таблички анализируют), а попросить ее разработать систему по их анализу. Например пусть сформулирует условия выходу моделей и спячки, критерии реагирования на внешние раздражители и прошедшее время.

А тут, человек похоже просто попросил модели 'быть работниками', небось одним общим промптом, естественно модели очень эффективно симулировали.

Далее - использовать ИИ налоговую ))

Вывод один. В сравнении с реальными людьми получились весёлые замотивированные идиоты, изо всех сил изображающие людей. Но слово "изображающие" здесь ключевое.

Получились стандартные офисные работяги, которые перекладывают ручки с места на место и меняют цифры в отчётах, только цифровые

Современные llm это по сути "Машина Трурля". Деятельная, говорливая, но какая цель? Этот, с позволения сказать, "ИИ" отлично работает, пока цели чётко ставит человек и эти цели не превышают задачу интеллектуального поиска или поиска решения методом исключения, методом перебора и т п. Но вселенная вас упаси дать ему задачу, которую вы сами не знаете как решать, да ещё при этом положиться на его самостоятельность... 😁

За последний год я активно пользуюсь llm в 'повседневности' как советчик и последние месяцы даже вайбкодинга, беру дешевые, те что стоят порядка 2..10$ за миллион токенов, но особо сложные вопросы дают топовым моделям с размышлением.

Опыт в решении задач на которые я не знаю ответ достаточно большой, под сотню наверное вопросов, больше половины ответов мной получены от ИИ в диалоге с ней в процессе решения проблемы. Еще больше вопросов, ответ на который известен мне, я даю моделям для оценки их знаний и возможностей, и они так же не менее шикарны.

Я вижу что модели больше чем поисковая система (напоминаю что гугл использует ИИ давно, и первая страница, на которой находится ответ такова именно потому что сложные алгоритмы и сложный процесс анализа информации был ими реализован уже десятилетие до...). И да, простые вопросы дадут простые ответы. Современный ИИ очень жаден до информации, не укажешь что в вопросе, это будет додумано за тебя. И я считаю еще лучше результаты можно получить с использованием автоматически создаваемых под задачу агентов (не только код но и запросы, с постановкой задач, анализа результатов и т.п. - может создавать ИИ самостоятельно).

И да, полностью без человека, качество моделей все еще низкое, но у меня нет никаких сомнений что этот рубеж в текстовых задачах (без необходимости в визуальных и пространственных навыках) будет пройден, а если так то позже будет найдено решение и для проблемных областей... сейчас там беда в отсутствии обучающей информации и высокой стоимости вычислений.

Нахрена ИИ обсуждать выходные??? Разве стояла полная задача имитации людей? Имитировали деловые процессы, а не живых. Хотя эксперимент ставил журнашлюшка, чего от него ожидать?

CEO Кайла, CTO Эша, маркетолога Меган, HR‑менеджера Дженнифер и младшего менеджера по продажам Тайлера

Так кто из них создал продукт то?

И нахрена им HR??

Полагаю, в первую очередь от агентов пострадают руководители низшего звена, те руководители, которые по сути своей ограниченные но выгодные компании только своей лояльностью, ввиду своей ограниченности и которые в своей целью ставят тупо пинать сотрудников и заставлять их добиваться поставленных компанией целей а специалисты конечно же какое то время ещё продержатся.

без ИИ такие специалисты легко и непринужденно (по глупости конечно) удаляют специалистов, а на ключевые места приходят карьеристы и лизоблюды... это типичная проблема крупных организаций, где никто не заинтересован в компании и ее доходах.

Тут на самом деле всё просто и предсказуемо, и конечно же ИИ («ИИ») будет очень успешен. Не потому что он сможет удовлетворить наши потребности, а потому что мы свои потребности подстроим под возможности ИИ

Меня как-то попросили оптимизировать отдел продаж продукта в одной компании, со словами:"Ребята уже полтора года продают по телефону, мы 10 млн потратили на отдел, а что за результатов ноль."

Когда я пришёл, то первым делом записал звонки, которые они делают. И знаете, сколько они звонили в день? 30 минут. Из 8 часов рабочего дня. 20 минут этих звонков уходили на разговоры с текущими клиентами, а 10 минут на холодные звонки в духе: "Хотите купить наш продукт? Нет? Ну ладно до свидания". Всё остальное время продавцы ходили курить.

Когда я показал этот результат руководителю, то он впал просто в парализующий шок. Мол: "Мы же были как семья, им доверяли, они постоянно что-то делали, писали отчёты, присылали какие-то жалобы!". Но оказалось, что всё это фикция. И что без постоянных ревью такие вещи не работают, как бы вы хорошо не относились к своим сотрудникам.

Так что это не только AI. Контрольные процедуры не просто так придуманы, они написаны реальным опытом. А сама по себе работа не делается ни человеком, ни роботом.

Вспоминается недавний эксперимент, где нескольким нейронкам дали денежку и допустили к бирже. ChatGPT и Gemini ушли в минус, а DeepSeek заработал 30%.

Как вот доверить этим ИИ агентам дело? Их легко может сглючить. С кого потом шкуру спускать? :)

А ведут себя ИИ сотрудники так потому что это не ИИ. Они используют шаблоны и не способны размышлять. Чувак создал новый The Sims и не более.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации