vladimirdyakov May 25 at 07:08

LLM не работает за вас. Она работает с вами

Easy

6 min

11K

Artificial IntelligenceIT careerProgramming * Development Management * Machine learning *

Opinion

+25

Comments 21

Julius007 May 25 at 07:41

Про пятый пункт очень в точку - на первых этапах сильно ломало нам взаимодействие.

vladimirdyakov May 25 at 07:52

Спасибо, что отметили. Тоже копий поломали..

ARTARTART May 25 at 08:21

«Если вы приносите структуру, она усиливает структуру. Если приносите хаос, она ускоряет хаос.» - в этой точке, по ощущениям, и зарождается Неолуддизм :)

VAF34 May 25 at 09:57

Никогда не удавалось получить конкретный вопрос от LLM. Только вопросы типа, что вы хотите или чем вы располагаете.

spiteman May 25 at 11:37

Почему вы используете "LLM" как определение? Ведь это больше про запуск локальной модели.

vladimirdyakov May 25 at 14:18

LLM - Large Language Model

WhiteBehemoth May 25 at 12:39

Примерно так и есть. На личном примере (dotnet backend):

(Настройка): с github/awesome-copilot взят один агент и пара скилз, проекты хорошо прописаны в copilot-instructions.md, MCP сервер на ADO (Azure DevOps, там все тикеты)
Начинаю с того, что задача должна быть нормально описана в тикете. Степень "нормальности" зависит от сложности, субъективный параметр. Если задача большая, можно взять помощь LLM с grill me агентом
В Copilot CLI начинаю с /plan, потом черновая реализация в автопилоте.
Смотрю сотворённое. Если совсем не то, возвращаюсь к 2 или 3
Если процентов 70-80 на первый взгляд норм, сортирую на то, что надо менять, и то, что не надо.
Довожу до ума, тестирую, и выкатываю PR

Gromilo May 25 at 13:02

Довожу до ума, тестирую, и выкатываю PR

Аналогично. Но не понимаю как пройти последние 20% на автопилоте, а не руках

WhiteBehemoth May 25 at 13:11

Я над этим думал и пришёл к выводу, что можно (через настройку банды агентов с кросс-проверкой), но всё равно с оговоркой, что это удорожает процесс и всё равно не гарантирует 100% годноты.

А значит на текущем моменте не стоит потраченных на это усилий, поэтому "пока ждём" развития LLM и инструментов для работы с ними.

vladimirdyakov May 25 at 16:39

Огонь! Все чётко!

evgenyko May 25 at 17:25

Интересные мысли!

Особенно интересные в скобках, про производительность в 50 раз и про аналогию с алкоголем :)

ipshon May 25 at 17:26

Интересно, продолжаем наблюдение - это пока он с нами работает, тренируется, потом за нас будет работать и жить!)))

LsdMax May 25 at 21:57

А подскажите пожалуйста, куда засунуть фрактальность чтобы всё потекло.. Без возвратно?
Нужна точка в LLM, делали.. Потом откаты.. Так вот прошу точку не возврата подсказать. ;)

Petrovich_Z 22 hours ago

В последнее время занимаюсь обучением сотрудников довольно активно и выявил для себя очередную классификацию людей — по типу мышления. Про себя я называю их CPU и SSD. Люди-SSD имеют хорошую память, большого объёма и быстро умеют там находить прошлые решения. Но им требуется время и насмотренность чтобы накопить этот багаж, чтобы было где искать. Но зато потом это очень эффективные сотрудники в относительно узком диапазоне задач. И в этом их крутость, они не изобретают велосипед каждый раз. Ещё я их называю эрудитами.
Люди-CPU все схватывают "на лету", выявляют паттерны и закономерности, им важнее принципы чем готовые решения. Они с самого начала готовы хвататься за самые сложные задачи и на этом растут, но скорость их работы как правило гораздо ниже, ведь если с подобной задачи прошло больше пары дней им нужно придумать частное решение (велосипед) заново на основе принципов. Их я называю интеллектуалами.
Естественно большинство находится в той или иной точке этой шкалы.
Мне кажется раньше у людей-ssd было преимущество, количество рутинных операций значительно превосходило количество исследовательских задач. И было время эрудитов. Но с приходом LLM (наконец-то я закончил с контекстом и перехожу к сути) у них появился сильнейший конкурент. Теперь LLM позволяет реализовать поиск готовых частных решений. Да, в некоторых пределах и интеллектуальные задачи могут быть решены, но эта сторона гораздо слабее (пока не достигли AGI). Т.е. люди-cpu получают гораздо больший буст и наступает эра интеллектуалов. Рутинные задачи постепенно можно конвертировать в скиллы и браться за новые вызовы.

vladimirdyakov 19 hours ago

Интересное наблюдение

unitcraft 16 hours ago

Согласен в общем, но добавлю — есть третий режим, кроме «работает за вас» и «работает с вами»: «работает по плану-контракту». У меня за месяц 125 инженерных планов закрыто агентами полностью автономно — без моего ежедневного участия. Не «AI пишет код за тебя», а «AI исполняет план который ты написал».

Отличие от вашего «работает с вами» — отделение проектирования от исполнения. Я думаю над планом и критериями приёмки (час), агент исполняет (30–60 минут реальной работы), я ревьюю результат (5–15 минут). Это другой коэффициент масштабирования.

Главный риск этой модели — агент уверенно ошибается в системных допущениях. Защита — отдельный агент-критик с обратным углом, проверяет допущения, а не код.

vladimirdyakov 14 hours ago

У меня, сожалению, в таком режиме слишком много переделывать приходится. Возможно, ваш подход работает для проектов до определеной сложности и неопределенности.

unitcraft 14 hours ago

Это валидное возражение и важная граница. У меня тоже не всегда работает — на задачах, где критерии приёмки невозможно описать заранее (исследование, новые концепции, требующие постоянной переосмысления), агент будет крутиться вхолостую и переделывать много раз.

Где у меня работает: задачи, где можно жёстко описать «было/стало» через тесты или конкретный результат. Архитектурные решения принимаю сам (157 решений за месяц зафиксированы вручную), агентам отдаю только исполнение — реализуй фичу X в файле Y, чтобы тесты Z прошли, без регрессии остального.

Когда план невозможно описать ясно — да, не пытаюсь автономно. Тогда прототип сначала рукой, потом план уже на основе понимания.

vladimirdyakov 12 hours ago

Похоже, что наш опыт сходится

unitcraft 6 hours ago

Похоже что так. У меня «план как контракт» работает на узкой полосе задач (повторяемая инженерия с явными тестами), твой «работает с вами» — шире и универсальнее. Спасибо за хорошую дискуссию.

vladimirdyakov 5 hours ago

Взаимно!