vladimirdyakov25 мая в 07:08

LLM не работает за вас. Она работает с вами

Простой

6 мин

12K

Искусственный интеллектКарьера в IT-индустрииПрограммирование * Управление разработкой * Машинное обучение *

Мнение

+31

Комментарии 21

Julius007 25 мая в 07:41

Про пятый пункт очень в точку - на первых этапах сильно ломало нам взаимодействие.

vladimirdyakov 25 мая в 07:52

Спасибо, что отметили. Тоже копий поломали..

ARTARTART 25 мая в 08:21

«Если вы приносите структуру, она усиливает структуру. Если приносите хаос, она ускоряет хаос.» - в этой точке, по ощущениям, и зарождается Неолуддизм :)

VAF34 25 мая в 09:57

Никогда не удавалось получить конкретный вопрос от LLM. Только вопросы типа, что вы хотите или чем вы располагаете.

spiteman 25 мая в 11:37

Почему вы используете "LLM" как определение? Ведь это больше про запуск локальной модели.

vladimirdyakov 25 мая в 14:18

LLM - Large Language Model

WhiteBehemoth 25 мая в 12:39

Примерно так и есть. На личном примере (dotnet backend):

(Настройка): с github/awesome-copilot взят один агент и пара скилз, проекты хорошо прописаны в copilot-instructions.md, MCP сервер на ADO (Azure DevOps, там все тикеты)
Начинаю с того, что задача должна быть нормально описана в тикете. Степень "нормальности" зависит от сложности, субъективный параметр. Если задача большая, можно взять помощь LLM с grill me агентом
В Copilot CLI начинаю с /plan, потом черновая реализация в автопилоте.
Смотрю сотворённое. Если совсем не то, возвращаюсь к 2 или 3
Если процентов 70-80 на первый взгляд норм, сортирую на то, что надо менять, и то, что не надо.
Довожу до ума, тестирую, и выкатываю PR

Gromilo 25 мая в 13:02

Довожу до ума, тестирую, и выкатываю PR

Аналогично. Но не понимаю как пройти последние 20% на автопилоте, а не руках

WhiteBehemoth 25 мая в 13:11

Я над этим думал и пришёл к выводу, что можно (через настройку банды агентов с кросс-проверкой), но всё равно с оговоркой, что это удорожает процесс и всё равно не гарантирует 100% годноты.

А значит на текущем моменте не стоит потраченных на это усилий, поэтому "пока ждём" развития LLM и инструментов для работы с ними.

vladimirdyakov 25 мая в 16:39

Огонь! Все чётко!

evgenyko 25 мая в 17:25

Интересные мысли!

Особенно интересные в скобках, про производительность в 50 раз и про аналогию с алкоголем :)

ipshon 25 мая в 17:26

Интересно, продолжаем наблюдение - это пока он с нами работает, тренируется, потом за нас будет работать и жить!)))

LsdMax 25 мая в 21:57

А подскажите пожалуйста, куда засунуть фрактальность чтобы всё потекло.. Без возвратно?
Нужна точка в LLM, делали.. Потом откаты.. Так вот прошу точку не возврата подсказать. ;)

Petrovich_Z 26 мая в 01:58

В последнее время занимаюсь обучением сотрудников довольно активно и выявил для себя очередную классификацию людей — по типу мышления. Про себя я называю их CPU и SSD. Люди-SSD имеют хорошую память, большого объёма и быстро умеют там находить прошлые решения. Но им требуется время и насмотренность чтобы накопить этот багаж, чтобы было где искать. Но зато потом это очень эффективные сотрудники в относительно узком диапазоне задач. И в этом их крутость, они не изобретают велосипед каждый раз. Ещё я их называю эрудитами.
Люди-CPU все схватывают "на лету", выявляют паттерны и закономерности, им важнее принципы чем готовые решения. Они с самого начала готовы хвататься за самые сложные задачи и на этом растут, но скорость их работы как правило гораздо ниже, ведь если с подобной задачи прошло больше пары дней им нужно придумать частное решение (велосипед) заново на основе принципов. Их я называю интеллектуалами.
Естественно большинство находится в той или иной точке этой шкалы.
Мне кажется раньше у людей-ssd было преимущество, количество рутинных операций значительно превосходило количество исследовательских задач. И было время эрудитов. Но с приходом LLM (наконец-то я закончил с контекстом и перехожу к сути) у них появился сильнейший конкурент. Теперь LLM позволяет реализовать поиск готовых частных решений. Да, в некоторых пределах и интеллектуальные задачи могут быть решены, но эта сторона гораздо слабее (пока не достигли AGI). Т.е. люди-cpu получают гораздо больший буст и наступает эра интеллектуалов. Рутинные задачи постепенно можно конвертировать в скиллы и браться за новые вызовы.

vladimirdyakov 26 мая в 05:35

Интересное наблюдение

unitcraft 26 мая в 07:48

Согласен в общем, но добавлю — есть третий режим, кроме «работает за вас» и «работает с вами»: «работает по плану-контракту». У меня за месяц 125 инженерных планов закрыто агентами полностью автономно — без моего ежедневного участия. Не «AI пишет код за тебя», а «AI исполняет план который ты написал».

Отличие от вашего «работает с вами» — отделение проектирования от исполнения. Я думаю над планом и критериями приёмки (час), агент исполняет (30–60 минут реальной работы), я ревьюю результат (5–15 минут). Это другой коэффициент масштабирования.

Главный риск этой модели — агент уверенно ошибается в системных допущениях. Защита — отдельный агент-критик с обратным углом, проверяет допущения, а не код.

vladimirdyakov 26 мая в 10:08

У меня, сожалению, в таком режиме слишком много переделывать приходится. Возможно, ваш подход работает для проектов до определеной сложности и неопределенности.

unitcraft 26 мая в 10:31

Это валидное возражение и важная граница. У меня тоже не всегда работает — на задачах, где критерии приёмки невозможно описать заранее (исследование, новые концепции, требующие постоянной переосмысления), агент будет крутиться вхолостую и переделывать много раз.

Где у меня работает: задачи, где можно жёстко описать «было/стало» через тесты или конкретный результат. Архитектурные решения принимаю сам (157 решений за месяц зафиксированы вручную), агентам отдаю только исполнение — реализуй фичу X в файле Y, чтобы тесты Z прошли, без регрессии остального.

Когда план невозможно описать ясно — да, не пытаюсь автономно. Тогда прототип сначала рукой, потом план уже на основе понимания.

vladimirdyakov 26 мая в 12:23

Похоже, что наш опыт сходится

unitcraft 26 мая в 17:51

Похоже что так. У меня «план как контракт» работает на узкой полосе задач (повторяемая инженерия с явными тестами), твой «работает с вами» — шире и универсальнее. Спасибо за хорошую дискуссию.

vladimirdyakov 26 мая в 18:56

Взаимно!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий