Arseny88 Jun 5 at 07:30

Меня бесит использование ИИ в разработке. И я наконец понял почему

Easy

4 min

22K

IT careerHealthArtificial IntelligenceDevelopment Management *

Opinion

+100

112

Comments 112

Roma_habr Jun 5 at 07:39

Пожалуй, соглашусь, но с оговоркой.

Из LLM-моделей - Claude Sonnet 4.6, немного Claude Opus 4.6, и Qwen 3.5-397B.

По моему субъективному опыту, выбор модели сильно влияет на результат. Использование последних выпусков Opus сократило бы необходимое количество дебагов по сравнению с Sonnet.
Но полностью не исключило бы ошибки 100%.

nidalee Jun 5 at 07:44

Claude Code действительно пишет Next как-то через жопу. На Opus 4.8 с high effort вроде нормально, а 4.7 обе модели - стабильно как минимум 1 ошибка из-за которой стейджинг\прод упадет. GPT5.5 на high в этом плане лучше - ни разу за месяц не было регрессий. Мог что-то не так понять или не доделать, но все работало.

В итоге для себя решил Opus для планирования и реально тяжелых задач, типа reverse engineering, Codex для работы по планам Opus-а и прочей мелочи типа отцентровать div.

Gorthauer87 Jun 5 at 07:58

High effort так то дороговато выходит

nidalee Jun 5 at 08:03

Для планирования нормально. Для reverse engineering выбирать больше не из чего кмк... Пока использовал GPT как исполнителя, даже тарифа за 20 баксов хватало.

vrnvorona Jun 9 at 07:58

На 100 баксах в месяц можно на xhigh не вылазя кодить на 5.5 и в ус не дуть.

gaal_dev Jun 11 at 11:07

https://www.reddit.com/r/GithubCopilot/comments/1tv77df/pov_youre_still_using_github_copilot_after_june/ POV: you're still using GitHub Copilot after June 1st, 2026. (вы всё ещё используете Копилот после 1 июня 2026)

Большие Языковые Модели (LLM) предсказывают наиболее вероятные токены (слова и тд) из своих "мешков слов" на которых их обучали, а не думают логически. T9 на стероидах

Python хорошо, Go и Java хуже, C++ и Rust швах (из-за макросов, владения объектами, освобождения памяти, малой обучающей выборки и т.д.). При этом Python самый медленный из них.

nidalee Jun 11 at 16:40

Я вайбкодил VPN-клиент, "переписывал" TunProxy + C + Java на Kotlin + C и немного Go, вопросов нет. Java даже дизассемблить умеет, сейчас мультиплеер мод для игры на Java делаю.

Bizonozubr Jun 12 at 05:53

А чем и как дизассамблерили Java? А с обфускацией как справляется?

nidalee Jun 12 at 06:20

Собственно говоря, автор игры был не агрессивный в этом плане. Ответ от Fable 5:

Дизассемблировали по минимуму: бо́льшая часть нужного кода вообще не обфусцирована — API игры поставляется в исходниках (starfarer.api.zip). Для сигнатур полей/методов из обфусцированного starfarer_obf.jar хватало штатного javap -p, а где нужно было читать логику — декомпилировали CFR 0.152. Обфускация там только переименование (без контрол-флоу и шифрования строк), причём ключевые классы (CampaignEngine, CampaignClock и т.п.) помечены DoNotObfuscate и имена сохраняют. Переименованные классы (com.fs.starfarer.B.B, классы с именами вроде super) CFR разбирает нормально, а идентифицируются они по реализуемым API-интерфейсам и строковым константам. Декомпилят — только как справочник, в мод ничего не попадает: доступ в рантайме через MethodHandles.

Bizonozubr Jun 12 at 06:23

Понял, интересно.

Dhwtj Jun 5 at 07:46

Одна из причин почему LLM многословен:

Он не знает, какие данные придут (хотя вы знаете), в месте обработки поставит много защитного кода (хотя это вы должны были создать типы чтобы невалидные данные были невозможны). Тогда в любом случае код не упадет.

Проблема ещё в том, что он не знает куда кидать ошибку (а это вы должны были позаботиться чтобы создать типы исключений или кодов возврата ошибок), поэтому молча её поглотит и не предупредит (а это вы должны были решить допустимо это мои надо падать и надо ли логировать)

LLM склонен к catch-and-swallow, потому что его цель "чтобы прошло/скомпилировалось", а не "чтобы упало громко при нарушении инварианта". Ну так вы должны были его предупредить что сверху кто-то ловит и исключения кидать можно. Ещё сильнее: дать ему как именно кидать тип ошибки (Result<T,Error> или конкретные exception-типы), тогда у него появляется куда кидать и он перестаёт импровизировать

Arseny88 Jun 5 at 09:13

хотя это вы должны были создать типы чтобы невалидные данные были невозможны

вы должны были позаботиться чтобы создать типы исключений или кодов возврата ошибок

Выходит, что на плечи агента можно возложить в основном только написание конкретной бизнес-логики, когда всё "окружение" для новой фичи в виде DTO, исключений, REST-клиентов, JMS-слушателей и проч. уже написано?

Dhwtj Jun 5 at 10:52

Как минимум, спроектировано полное описание контракта (а контракт включает типы данных на входе , выходе и обработку ошибок) и одобрено человеком

Spiritschaser Jun 5 at 14:23

А может, он просто обучен на худших решениях с stackoverflow?

Rive Jun 6 at 07:26

Агенты же уже не просто предсказатели следующего слова по промпту и сиду, а закольцованные системы, которые при хорошей настройке проверяют код на компилируемость, запах, соответствие задаче, прохождение тестов и тому подобные вещи.

Spiritschaser Jun 6 at 17:43

при хорошей настройке проверяют код на компилируемость, запах, соответствие задаче, прохождение тестов и тому подобные вещи.

Где-то тут была история, как агенты к ТЗ нафигачили тесты, чтобы их проще проходить было

компилируемость

Да ладно, а на утечки памяти проверяют?

cdriper Jun 6 at 07:06

в месте обработки поставит много защитного кода

а вы лично хоть раз агента пользовали или только по телевизору смотрели?

гарантированная проблема всего сгенерированного кода это ужасная обработка ошибок и граничных условий.

а многословен он потому, что генерит все "как есть" даже не пытаясь "вспомнить", что секунду назад он генерировать метод, который почти полностью совпадает с текущим, и поэтому общее тело надо выделить в отдельный метод и переиспользовать.

Spiritschaser Jun 6 at 17:44

Мне вчера ИИ ещё и выстраданный мной парсер хитровыдуманного JSON "оптимизировал". Долго искал, где косяк.

Spiritschaser Jun 7 at 13:20

Вот буквально вчера вычищал "проверки" из сгенерённого кода. Вообще не нужные (в случае, который проверялся, из ветки выход был бы раньше).

youngmysteriouslight Jun 6 at 18:38

Не вайбкодер, но считаю эту аргументацию шаткой.

Он не знает, какие данные придут (хотя вы знаете)

Это написано в документации к методу.

Проблема ещё в том, что он не знает куда кидать ошибку

Автор пишет:

Несмотря на наличие в проекте большого количества примеров того, как должны быть написаны юнит-тесты,

значит, в контексте агента есть множество стереотипных примеров, куда кидать ошибку, а он их проигнорировал. Кстати, раньше мне казалось, что LLM должны хорошо справляться с написанием по образцу. Получается, он работать умеет только по подробной спецификации?

netricks Jun 5 at 08:00

Стандартная выработка программиста - две тысячи строк в неделю. Стандартная выработка вайбкодера - шестьдесят тысяч строк в неделю. При таких масштабах сама идея прочитать код написанный сеткой попахивает безумием. Не вы первый, кто заметил, что стратегия эта не работает.

Arseny88 Jun 5 at 09:09

Вайбкодинг это вообще отдельная история. Мне кажется, там пытаться что-то понять вообще не имеет смысла, если проект хоть сколько-нибудь большой, так как все изменения делались человеком, который в принципе не имеет каких-либо знаний и экспертизы, вследствие чего и способности определить правильность написанного кода. При попытке ревьюить такое количество нейрокода, который не подвергся хотя бы первичной валидации тем, кто его генерировал, есть риск получить психическую травму :)

Думаю, в данном случае уместнее сравнивать выработку обладающего квалификацией инженера с использованием агента и без него.

netricks Jun 5 at 10:08

Vibe code, ai assistant programming, ai agentic enginering... Какая разница, как это называть. Вы не сможете нормально пользоваться нейросетями при разработке, пока не научитесь проверять код не читая его.

Dhwtj Jun 5 at 11:25

Научите надёжно проверять код не читая его.

netricks Jun 5 at 11:30

Вот как раз статью готовлю. Думаю, сегодня уже будет ближе к вечеру

Dhwtj Jun 5 at 13:05

Тегни меня в ответ, я прочитаю

netricks Jun 5 at 14:41

Не понял, где тегать. В любом случае, вот: https://habr.com/ru/articles/1043842/

nidalee Jun 6 at 03:42

Вот так @netricks

gaal_dev Jun 11 at 11:13

Вжух и ф продакшн - нейромесиво какое-то

Kirillstavropol Jun 9 at 17:14

Берёшь штук пять ии, например qwen, DeepSeek, Copilot, ещё пару, выбери ту первую код чей нравится больше всех напиши что нибудь проверь и проверяй остальными, я начинал с DeepSeek - qwen - Copilot, потом перешёл на qwen - DeepSeek - Copilot, сейчас на Copilot - DeepSeek остановился, qwen кучу самоповторов делает прямо не помнит что то что сейчас рекомендует мы с ним делали пять минут назад, ещё и обвинять начинает что я его рекомендации не выполнил, qwen coder и тупой и медленный, ему говоришь прям как приказ не используй wpf, не используй WinUI2, нет всеравно весь проект на WinUI2, создаст ну хоть ui красивые умеет делать, у DeepSeek с этим огромные проблемы

Dhwtj Jun 11 at 07:59

также бредово как и доверять тестам, которые LLM написала

не поймает разницу между намерениями и спеками

gaal_dev Jun 11 at 11:19

Это Вы так думаете :D У меня на работе так и делают особенно доверяя тесты БЯМ

sYB-Tyumen Jun 5 at 11:47

А технически вообще возможно "проверять код не читая его"? Понятно, что есть всякие линтеры, анализаторы и прочие инструменты.

Но есть же ещё "насмотренность", когда опытный глаз видит в коде что-то не то. И иногда можно долго копать, прежде чем сознание поймёт, что именно "не то" угляделось и к каким конкретным ошибкам может приводить.

А если вместо органических нейросетей применять электронные, то не получится ли так, что описание логики работы и контрактов, достаточное для адекватной работы LLM, будет практически не отличимо по потраченному времени и ресурсам от написанного вручную кода?

Dhwtj Jun 5 at 13:12

возможно "проверять код не читая его"?

Только когда бизнес требований и ограничений значительно меньше чем общих знаний, которые уже кто-то прочитал, выверил и доказал, но не в этом проекте.

Либо кто-то путает код и данные

Dhwtj Jun 5 at 10:44

Стандартная выработка вайбкодера - шестьдесят тысяч строк в неделю

6 дней в неделю по 10 kloc?

Мсье явно уже встречал такую дичь в реале

netricks Jun 5 at 11:04

Мсье встречал 130 тысяч. Но это прямо напряжённая неделя была

netricks Jul 11 at 22:07

Поправка... Мсье встречал 100kloc за два дня 0_o...

mahmud90 Jun 5 at 12:17

Стандартная выработка вайбкодера - шестьдесят тысяч строк в неделю

"Стандартная" как бы намекает, что есть какая-то статистика по вайбкодингу. Или судите больше по себе? Кто имеется в виду под вайбкодером - опытный программист, начинающий или не-программист? И что можно сказать о "стандартном" качестве такого кода?

netricks Jun 5 at 12:37

Да. Статистика есть. Она, конечна, взята по полутора калекам, но вряд ли мы с коллегами сильно отличаемся от общечеловеческой массы. Число в 60 тысяч плюс минус трамвайная остановка упорно повторяется. Я бы сказал, что моя рабочая оценка.

Нет, не новички. Вообще ни разу не новички. Качество разное. Тут надо понимать, что большая часть этих шестидесяти тысяч уходит не на написание нового кода, а на переписывание старого. По мере переписывания качество подтягивается.

Ну, а в целом, моя статья по вайбкодерским практикам уже почти вот-вот.

Persik1 Jun 5 at 16:33

Если у вас вайбкодер генерит по 60к строк, значит у вас нет нормального код-ревью и CI/CD пайплайнов с жесткими лимитами на покрытие тестами и цикломатическую сложность

netricks Jun 5 at 16:37

Верно

devoln Jun 6 at 05:57

У меня две $20-подписки Codex, у которых использую все лимиты под ноль для двух backend+frontend проектов на TypeScript. Получается до 15к строк в неделю кода, включая тесты и доки. Все доки читаю, код читаю по диагонали и интересные части. Обычно трачу всю недельную квоту за 2 дня, а в остальное время изучаю, тестирую более внимательно и делаю огромный коммит, где всё понамешано. Пока это не прод и проекты полностью мои.

Код наверное в 2 раза более многословный, но при этом есть возможность оптимизировать горячие места типа размера собранного бандла, кеширования в браузере и т.п., где руками пришлось бы долго экспериментировать и анализировать, а тут агент всё за меня сделал.

Также могу легко вылизывать UX, делая всяких плюшки, до которых руки бы вообще не дошли: индикация прогресса, кастомные компоненты и т.п..

А на работе C++, там пока до активного ИИ не созрел кроме как сгенерировать класс и потом детально его изучить и отредактировать руками. Ну и баги агенты помогают искать. В текущих задачах слишком много нюансов качества кода, производительности и управления памяти, которые я не готов доверить агентам. Но после этих задач может и буду использовать ИИ-код активнее в задачах попроще.

gaal_dev Jun 11 at 11:24

C++ не самый БЯМ-ный язык программирования из-за макросов, неопределенного поведения, управления памятью и тд. И выборка обучающая намного меньше чем например у Python или JS

Kirillstavropol Jun 9 at 16:58

А для llm ну так на вскидку 200000 в сутки, пусть миллион в неделю это тысяч в 5 больше чем у программиста, пока программист один скрипт написал, llm 50 штук и каждый по 100 раз отполировала

netricks Jun 9 at 17:17

На такое много токенов надо...

nuclight Jun 15 at 02:14

Где столько нашли? В стартапах штоль? В энтерпрайзе норма была 50 строк в день.

Gorthauer87 Jun 5 at 08:01

Я вот активнее всего использую ИИ для анализа кода, анализа текстов, анализа логов, и ещё для саммаризации изменений во время ревью пул реквестов. И ещё для поиска и разборов информации.

И вот это жизнь куда больше упрощает, чем вайбкодинг. В плане написания кода я ИИ доверяю лишь рефакторинг и то очень понятный и дописание тестов по примеру.

Ну и документацию, потому что лучше такая дока чем вообще никакая.

aabzel Jun 6 at 13:09

читаю

Я вот активнее всего использую ИИ для анализа кода, анализа текстов, анализа логов, и ещё для саммаризации изменений во время ревью пул реквестов.

понимаю

Я вот активнее всего использую ИИ для слива компанейского кода в сеть, слива в интернет внутренней документации , расскрытия коммерческой тайны .

Gorthauer87 Jun 7 at 08:20

Вообще не к месту. На работе у нас свой ИИ, дома опенсорс. Это полностью изолированные контура.

Не надо читать того, что нет в тексте

vrnvorona Jun 9 at 08:00

Теории заговора от ИБшников финтеха

radim_tcar Jun 5 at 09:14

Сейчас они реально полезны только как инструмент для ускорения рутинных задач. Но в задачах со строгими архитектурными ограничениями они часто увеличивают общий объём работы, генерируют избыточный, нестандартный или потенциально некорректный код, который потом нужно тщательно вычищать и перепроверять. По факту происходит не снижение когнитивной нагрузки, а её перераспределение, с написания кода на его ревью и контроль качества, причём часто с ростом затрат. Поэтому твой вывод корректный, сегодня ИИ это не замена разработчика, а инструмент с высоким риском и неоднородной выгодой, эффективность которого сильно зависит от типа задачи и зрелости процесса разработки.

sWitched0ff Jun 5 at 09:16

Странное заявление про детерминированный результат от человека. Неужели вот прям действительно каждый раз реализацию делаете одними и теми же методами? Никакого развития и повых методов, копипаста одного и того же? У меня часто бывает пока какой-то незначительный баг копаю находится повод поразмыслить а не переписать ли ещё половину системы чтобы лучше работало.

Dhwtj Jun 5 at 11:57

Статистика говорит, что розгами и плетью от джунов можно добиться больше дисциплины, чем от LLM

Arseny88 Jun 5 at 15:53

Возможно, я не до конца раскрыл мысль про более детерминированный результат от человека.

Когда я пишу/изучаю код, пытаюсь поймать и пофиксить баг, делаю рефакторинг и проч., я произвожу действия частично или полностью с осмыслением того, что я делаю, т.е. с учётом архитектуры проекта, технических и бизнесовых ограничений и ньюансов, здравого смысла, последствий от одного, казалось бы, маленького изменения, и так далее. В случае генерации кода агентом, у меня сложилось впечатление, что ЛЛМ ничем подобным не руководствуется или руководствуется частично, упуская те или иные ньюансы, из-за чего даже валидное на первый взгляд решение на самом деле может таковым не являться.

i86com Jun 7 at 11:55

Не пробовал Opencode, но звучит так, что вы кодите "в режиме чата", вручную скармливая LLM крохи контекста. Особенно с учетом фразы "Но чаще всего не работающего, особенно с первого раза".

Так даже топовые модели ерунду пишут (и настаивают на своей правоте) и так никто сейчас не делает. Попробуйте Cursor или любую другую современную AI IDE. Он сам находит нужный контекст, анализирует, где на проекте уже что-то подобное делалось и почему именно так. Он грепает по файлам со скоростью света - вы ещё не успеете прочитать, что он ищет, а он уже нашёл, прочитал, сделал выводы и пошёл искать следующее.

Озвученных проблем уже несколько лет не встречал, пока не решил однажды на пробу в режиме чата с одной из свежих Sonnet написать простенький скрипт по текстовому описанию. Написало криво, с ошибками в коде и логике, как какой-нибудь ГигаЧат, ей богу, разница очень значительная.

Persik1 Jun 5 at 16:37

Детерминированность тут означает, что человек понимает, что и зачем он пишет. Он может обосновать каждое архитектурное решение. А сетка просто подставляет статистически наиболее вероятный токен

janvarev Jun 5 at 09:31

Интересно, что да - вот я хоть и занимаюсь сетками профессионально, а на практике скорее склонен кинуть конкретную задачу в чат по конкретному куску кода, нежели использовать агентов (агенты как-то пока не прижились).

По конкретному куску кода отвечает и переписывает хорошо.

jetnet Jun 5 at 10:48

Но непредсказуемость сама по себе создаёт дополнительную когнитивную нагрузку,

А кому щас легко?

Revertis Jun 5 at 13:55

Попробуйте нормальный Claude Code и нормальный стек технологий и ЯП.

Arseny88 Jun 5 at 19:44

Сомневаюсь, что Java/Kotlin и фреймворк Spring не попадают в разряд нормальных ЯП и стеков технологий)

Revertis Jun 5 at 20:09

Я тоже сомневаюсь, хотя при разработке под Android всё-таки Клод туповат немножко по сравнению с разработкой на Rust.

gaal_dev Jun 11 at 11:29

Потому что AOP это скорее пространственные и неявные зависимости, а БЯМ последовательное предсказание следующих токенов (по обучающим выборкам). Это не логическое мышление и не интеллект, а "мешок слов". В Spring нелинейные зависимости bean-ов. Стохастический попугай точнее калькулятор. Не ищите интеллекта там где его нет:)

Persik1 Jun 5 at 16:29

Автор прав в главном - когнитивная нагрузка при чтении чужого кода всегда выше, чем при написании своего. И неважно кто его писал, ИИ или коллега из соседнего отдела

SabMakc Jun 5 at 18:18

От ИИ нагрузка выше. Мало того, что кода ИИ генерит больше, так еще и подвох может быть в очень неожиданных местах, из-за чего надо быть очень внимательным.

codecity Jun 5 at 19:37

Проблема в том, что доведение сгенерированного кода до качества, соответствующего уровню продуктивного контура, занимает ничуть не меньше, а иногда и намного больше времени, чем если бы код писался руками.

Есть выход - отделить архитектуру от реализации. Чел. отвечает за контракты, за архитектуру - и даже не заглядывает что там за страх оно нагенерило. Начнешь заглядывать и делать правильно - весь буст так называемый сойдет на нет.

Arseny88 Jun 5 at 19:50

При таком подходе использование ИИ допустимо только в MVP-решениях и относительно простых проектах, не претендующих на что-то значимое. В "серьёзных" продуктах, такой код просто не пройдёт по критериям безопасности, производительности, uptime, стабильности, поддерживаемости и расширяемости и т.д.

codecity Jun 5 at 21:00

допустимо только в MVP-решениях и относительно простых проектах, не претендующих на что-то значимое

Ваша правда. Для внутренних утилит или скриптов, с легко проверяемым поведением, для MVP-проектов (проверка идеи). Т.е. когда есть четкий API (задан человеком) и критерии приемки, полное прокрытие поведения тестами (тесты дергают API и происходит то что задумано).

Когда нужно качество (быть лучше других, а не просто работать), поддерживаемый код - то надежнее и быстрее руками.

Но! Многие пока об этом не знают, LLM-ки начали активно использовать сравнительно недавно, а некоторые даже не начинали. Пока есть вера в чудо...

Gadd Jun 6 at 05:51

Подушню оффтопиком: вы перепутали MVP и POC

SabMakc Jun 5 at 20:27

К сожалению, LLM - это именно что “T9 на стероидах”. Они обучаются буквально в виде “продолжи текст”. Это практически чудо, что они просто в состоянии поддерживать беседу. Причем неплохо поддерживать.

То, что LLM “знает” как правильно писать код, может объяснить код - ни разу не значит, что она эти знания применяет при написании кода. Это просто разные навыки у LLM. Размышления помогают, но размышления, зачастую, это просто “набросать в контекст по теме”. Да, это дает значительный буст. Но мыслить модель от этого не стала.

Но LLM пришли, показали неплохие результаты, в том числе и в кодинге. Причем даже локальные модели. И они с нами надолго - если не на всегда, то точно до момента, когда изобретут что-нибудь более продвинутое.

gaal_dev Jun 11 at 11:53

Так и будем страдать под властью стохастических калькуляторов :D

Diamon33 Jun 5 at 20:37

меня бесит их фундаментальное качество - недетерменированность результата.

В смысле, Вы ожидали от недетерменированного механизма детерминированного поведения?

Spec-Driven-Development + Skills = ok

Архитектура теперь критически важна, и ее нужно знать, а часы написания кода можно свалить на LLM.

LLM и не может пока с полуслова понимать, что Вы хотите, иначе Вас бы давно уволили. Было бы это лучше или нет?

Lecron Jun 6 at 07:29

Можно ли осознать и впитать нюансы верхнего уровня, не проведя кучу часов на нижнем?

Вы смотрите с позиции того, кто этот нижний уровень исходил вдоль и поперек. Тогда можно свалить на LLM. Но, кмк, невозможно развиваться в архитектуре, изначально сваливая написание.

Groramar Jun 5 at 21:21

Думается, что все претензии из-за неумения ставить задачу нейронкам. Не нравятся полотна кода? Просите сети делать максимально компактный код. Получается неоптимально по скорости? Просите делать оптимально. Это не 'высосано из пальца'. Это реальные рекомендации по сотням чат-сессий.

Ну и да, актуальные LLM'ки фундаментально недетерминированные. Ожидать от них противного не стоит.

В любом случае буквально всегда есть вариант: не нравится - не используйте.

vita_soft Jun 6 at 03:53

Как не дает? Знать ты не так просил! (с)

Astrowalk Jun 6 at 08:28

«Пиши правильно, кратко и без ошибок». Идеальный промпт найден!

vvbob Jun 6 at 05:11

Есть один знакомый. На волне хайпа IT пытался вайтивайти, донимал разными вопросами с чего начать и как получать 400К денег в секунду, желательно ничего не изучая. ЯП с их дурацким синтаксисом у него вызывали головную боль и депрессию. Не вкатился, естественно.. Недавно звонил и спрашивал что делать если ИИ как-то не так прикрутило оплату к сайту заказчика, он ему уже и так и эдак давал задание, но тот что-то криво прикручивает.. Чувак вайбкодит вообще не отдупляя что там под капотом. Я знатно охренел.. но видимо это и есть оно, наше будущее, неизвестно что нагенерированное по требованию ~~макаки~~ вайбкодера, как-то там вроде работающее..

gaal_dev Jun 11 at 11:58

Профанация профессии инженера-программиста. По хорошему нужно требовать сертификацию и дипломированность погромистов как в хирургии и архитектуре. На пушечный выстрел не подпуская дилетантов.

vvbob Jun 17 at 08:39

Бизнесу это не нужно, ему нужен быстрый результат здесь и сейчас, поэтому такие вот "программисты" сейчас оказались востребованы.

nuclight Jun 15 at 02:51

Таким надо отвечать: Представь, что ты к своему дому приделал кладовку, а она как-то раз обвалилась и убила человека? Кого посадят? Тебя посадят! Потому что незнание сопромата не освобождает от ответственности - кто тебе мешал нанять эксперта, если сам не понимаешь…

vvbob Jun 17 at 08:41

Ну, сажать его точно никто не будет, в худшем случае система напутает что-то с деньгами и заказчик получит убытки и скандал с покупателем, в целом, наверное, даже и хорошо если это случится, возможно это заставит их чуток задумываться перед тем как нанимать на выполнение работ не пойми кого.

devoln Jun 6 at 06:06

Мне наоборот кажется, что ИИ разгрузил мне мозг и помог искоренить прокрастинацию. Раньше было сложно сесть за работу и решение задач, а теперь легко, можно начать с вопроса или дачи задачи агенту. Разгребать то, что он написал, тоже проще, чем своё придумывать, если не пытаться понять всё досконально и сразу как он сгенерировал, а только после тестирований и исправлений проверять важные моменты. Их тоже можно у агента спрашивать.

В итоге я за компом 10 часов в сутки 7 дней в неделю что-то разрабатываю, потому что процесс затягивает. Руками я в 5 раз медленнее бы двигался и не мог бы проводить столько времени за разработкой.

Arseny88 Jun 14 at 07:32

Раньше было сложно сесть за работу и решение задач, а теперь легко, можно начать с вопроса или дачи задачи агенту. Разгребать то, что он написал, тоже проще, чем своё придумывать, если не пытаться понять всё досконально и сразу как он сгенерировал, а только после тестирований и исправлений проверять важные моменты. Их тоже можно у агента спрашивать.

Не боитесь, что при таком подходе рано или поздно разучитесь самостоятельно разрабатывать ПО? (продумывать архитектуру абстрактную и прикладную, писать код как можно более качественный, продумывать краевые случаи для тестов, и т.д.)

На своём опыте, использование ИИ и агентов сильно отупляет на длинной дистанции, становится просто лень думать самому. А если и пытаешься думать, то внезапно оказывается, что думать ты разучился, многое позабыл и в итоге словил жёсткий откат по проф. навыкам

devoln Jun 14 at 07:59

Я пока работу в основном руками делаю, потому что как раз там продуманная архитектура и качественный код, и портить не хочется. Сейчас ИИ там для каких-то уже продуманных задач, когда нужно сделать что-то новое, а не редактировать существующий код. И самому продумыванию ИИ помогает - пишу документ, в котором сразу пытаюсь продумать все нюансы, которые сложно уместить в голове вместе и проверить на конфликты. Но если и генерирую код для рабочего проекта, я пока ещё пытаюсь досконально понять каждую строку кода.

Но вот на свои проекты раньше не хватало сил, чтобы двигаться хорошими темпами, а теперь хватает, и делаю так, как выше написал - с ИИ. Бесит конечно многословность и качество кода, но зато я хотя бы доделаю и запущу свой проект.

Кроме того, у меня недорогая подписка, поэтому часто кончается квота, и приходится разгребать и думать регулярно самому.

Не думаю, что я с таким подходом разучусь думать. Просто иногда это становится лень, но если регулярно перебарывать, то норм.

А тесты я практически до ИИ и не писал.

cdriper Jun 6 at 07:14

надо просто понимать ограничения технологии и просчитывать, что можно делегировать и выиграть в итоге по времени, а что будет пустой тратой сил и токенов. всегда есть куча рутины, с которой агенты вполне себе справляются.

Lecron Jun 6 at 07:22

Недавно иначе взглянул на тезис "Достаточно подробная спецификация — это код". Не как повод похоливарить, а представить код работающего проекта, в качестве этой спецификации. Вместо ее описания на естественном языке. Куда уж подробнее.

Сетка должна уметь написать код на целевом языке, с учетом его практик и концепций. Показать свой действительный уровень. И это не просто показатель уровня, а полезность в рефакторинге и переносе прототипов в другую среду.

VVizard Jun 6 at 07:55

Вот только что бы написать такую спецификацию нужно быть самому в контексте.

Приведу цитату:

Отдельно Хайтауэр предупреждает об опасности бездумной генерации. Он вспоминает старую формулу "писать — значит думать": когда инженер пишет код сам и медленно, он спотыкается о собственные ошибки, понимает, что выбрал не ту структуру данных или что архитектура трещит по швам. ИИ выдает тонны готового кода за секунды, разработчик радостно отправляет его в прод, пропуская этап мысленной валидации, — и так плодится высокоскоростной технический долг".

Как правило разработка ведётся в контексте какой то предметной области. Причем ТЗ/ФТ пишут обычные люди. Я 25 лет занимаюсь разработкой и ещё не встречал "идеальной спецификации".

Как правило в процессе разработки все документы корректируются, уточняются. Часто приходит понимание что лучше сейчас изменить архитектуру чем спустя 3 релиза.

У всех по разному но я например активно участвую в встречах аналитиками где обсуждается спецификация. Но если я перестану писать код то я быстро потеряю контекст.

Проблема даже хороших инструментов (моделей) в том что они дают то что ты просишь а не то что тебе нужно.

Банально, потому что до разработки ты знаешь чего ты хочешь, но ещё не знаешь что тебе нужно.

Даже казалось бы элементарные задачи опасно делегировать. Недавно была задача загрузить файл в систему, идеальный кандидат на работу ИИ, но закончились лимиты и делал сам, в итоге обратил внимание что в задаче описан поиск договора, но при этом пропущена часть о доп. соглашении и в тестовых данных нет так как этот функционал только что вошёл в релиз.

На вайбкоде я бы это пропустил и потом бы пришлось править ошибки. Так как я делал сам то я обратил внимание на это, сообщил аналитику и они доработали требование.

Хотя конечно я часто использую ИИ но как правило для review когда уже MVP написан, задачу я понял, и дальше просто скучная рутина (потому и месячная подписка улетает за неделю).

Ещё классно писать модульные тесты, это как новый фреймворк который может изучить код и предложить варианты тестовых данных.

Но именно режим вайбкодинга это 100% смерть продукта и проекта. Это как обосраться в мороз, первое время тепло.

Lecron Jun 6 at 08:02

Вы кажется не поняли смысл моего поста. Он не про вайб, а как раз наоборот. Есть проект/модуль или нечто высокого уровня, написанный на каком-то из языков программирования — C/C++, Java, Python. Работающий, функциональный, (достаточно) качественный. Это идеальный промт. Перепиши, например, на Rust.

peacemakerv Jun 6 at 07:41

Абсолютно соглашусь с тем, что нервная нагрузка и усталость от вайбкодинга - сильно повышенная.
Я провел эксперимент над собой - смогу ли я полностью бесплатными нейросетями навайбкодить себе замену Asana, а точнее - по сути свой чат, замену Телеграму (но мессенджер с привязкой в неким задачам).
При том, что знаний в этих web-технологиях всех, наверное не больше 10%.
Столкнулся с тем, что плохо спал все эти три недели эксперимента - гонка за получением правильного результата от нейросетки и бесит и приносит удовлетворение от победы одновременно.
Но устаешь неимоверно, и матерится стал впятеро чаще. Больше такой опыт повторять не хочется.

Хотя результата я достиг, за три недели наваял в одного полностью бесплатно систему, в которой уже 37+ тысяч (!) строк (PHP + MariaDB + Javascript (который я уже возненавидел)).

Если кому-то интересен такой личный таск-мессенджер - обращайтесь.
https://pmaker.ru/задачат_функционал/

aabzel Jun 6 at 11:54

старался описывать задачи подробно, добавлял контекст, объяснял не только что нужно сделать, но и как.
Замечу, что на формулирование и написание детализированного промпта для получения мало-мальски приемлемого результата уходило немало времени - иногда сопоставимо с тем, чтобы написать код самому.

Да, есть такое..

aabzel Jun 6 at 12:56

код работает, то он почти никогда не следует каким-либо best-practice. Он многословен, избыточен, а порой и неэффективен по использованию ресурсов.

Да. Так и есть.

anonym0use Jun 6 at 18:55

У меня на проекте есть коллеги которые полностью расслабились и отпустили эту жизнь, льют в репо 100% генерированный с 1 промта код, видно что даже без редактирования, CtrlC + CtrlV, проект постепенно превращается в кашу.

Соглашусь с автором в том что ИИ генерит многословный код, использует редкие, сложные конструкции языка, код в некоторых местах выглядит инопланетно, тяжелее читается, если в таком коде ошибка, то самому дебажить это очень больно.

Также отдельная боль это мержить правки с этой кашей, ИИ любит переписывать весь или почти весь файл целиком, меняя отступы и т.д., в итоге вместо нескольких блоков/строчек конфликта - весь файл один большой конфликт.

Но зато быстро, менеджмент в восторге, фичи релизятся одна за другой, на рост техдолга пока закрываются глаза.

isumix Jun 6 at 20:00

Потому что язык программирования намного более компактный и точный в описании задачи чем человечий язык. Человечьим языком проще описывать шаблонные и широко известные вещи, но чуть уходишь в сторону кастомизации, как понимаешь что ЯП с этим справтся лучше, для этого он и был создан.

MShevchenko Jun 6 at 23:56

Я, слава Богу, не пишу для веба уже лет 25.

Для своего проекта использую C/C++. Claude очень не плохо справляется при постановке мелких задач. По сути я его воспринимаю как Near-Middle.

Можно сказать что ограничение промта можно определить как "то что ты сам можешь сделать за день-два".

Очень хорошо справляется с задачами типа "перенести этот алгоритм из Mallab в OpenCL/CUDA". Такие задачи сложны для имплементации в лоб. Очень высока трудоемкость и вероятность ошибки.

blurman Jun 7 at 07:23

Недетерминизм вывода опознали верно — это и правда корень, и убрать его нельзя, это природа модели. Но вывод из этого не «инструмент плохой», а «надо строить контур, который ловит мусор без чтения глазами». Про тесты соглашусь — сгенерённые заодно с кодом часто ничего не проверяют. Но жёсткие типы и контракты (про что выше Dhwtj), статические анализаторы, линтеры, плюс тесты, написанные до кода под инвариант, — всё это ворота, а не ещё один артефакт на ревью. Контур ловит локальный мусор. Архитектурный дрейф, мёртвый код, тихо переписанные «заодно» классы он не поймает — это остаётся на человеке. Но именно это и есть нормальная граница: машина пишет по контракту, границы держишь ты.

slonopotamus Jun 12 at 09:46

убрать его нельзя, это природа модели

temperature=0

blurman Jun 12 at 10:34

temperature=0 убирает сэмплирование, но не превращает модель в context -> code компилятор.

Остаются batching, погрешности параллельных вычислений на GPU, изменения на стороне провайдера и обвязка инструмента.

У нулевой температуры есть и свой минус: она жёстко выбирает самое вероятное продолжение. Если модель в начале неверно поняла задачу, она может дальше уверенно тащить эту ошибку за собой.

slonopotamus Jun 12 at 10:40

изменения на стороне провайдера и обвязка инструмента

Скачиваем конкретную модель, запускаем локально.

погрешности параллельных вычислений на GPU

Там есть недетерминизм? Откуда?

Ну в общем мой посыл в том что если вам не нравится недетерминизм, его можно устранить.

Если модель в начале неверно поняла задачу, она может дальше уверенно тащить эту ошибку за собой.

Остановите её, добавьте уточняющую информацию и запустите заново? Но к недетерминизму это отношения не имеет.

slonopotamus Jun 12 at 16:34

Ну и этта, вы как-то ловко перескочили с “это природа модели” на особенности железа / окружения. Хотя модель - всего лишь набор весов, который можно считать на чём угодно, хоть на бумажке с ручкой.

Registan Jun 7 at 12:29

Замечаю, что очень многое мы прощаем агентам по сравнению с людьми. Допускать в коде архитектурные ошибки, которые описаны даже в любой книге «для чайников» - неуместно для любого профессионала, а особенно для того, кто пытается захватить весь мир разработки.

Использую чат для генерации небольших кусков кода и проверки существующего, здесь бесценный инструмент.

aabzel Jun 8 at 05:13

Читаю

Использую чат для генерации небольших кусков кода и проверки существующего, здесь бесценный инструмент.

Понимаю

Использую чат для слива фирменного техзадания и слива финальных исходников организации, бесценный инструмент для НАТО.

gun_dose Jun 7 at 20:43

Не верю, что нормальный программист не сумеет заставить ИИ писать такой же код, как пишет он сам. Полгода назад даже бесплатный Copilot с Haiku 4.6 отлично с этим справлялся. Добавляешь нормальный контекст, в котором видно стиль кода проекта, и ставишь маленькую задачу на пару сотен строк кода. Потом эти пару сотен строк ревьювишь за пару минут и исправляешь пару ошибок. Всяко быстрее, чем набирать самому. И это даже с бесплатным инструментом с моделью для бичей.

А если у тебя полчаса уходит, чтобы сформулировать мысль, а потом ещё полчаса на ревью 200-300 строк, значит такой ты программист. И нечего на инструменты пенять.

Dhwtj Jun 8 at 19:51

А 10.000 строк, которые нужно заменить сможет?

Вот то-то и оно.

gun_dose Jun 9 at 06:45

Если ты программист, который собирается предоставлять какие-то гарантии качества своего кода, то ты не будешь ставить такие задачи, чтобы нейронка тебе делала 10000 строк за раз. Если какие-то идиоты генерят тонны кода, не глядя, это не значит, что не существует других сценариев использования ИИ. И если программист не в состоянии найти сценарий, в котором ИИ помогает без потери качества, то такому программисту ещё до ИИ было не место в профессии.

nuclight Jun 15 at 03:06

Глупость какая. В тех 200-300 строках вполне может оказаться такое, что и два часа ревьювить можно, по-хоршему - мало ли что туда затесалось?! Конечно, если это не реальный проект, а вебня какая, такое маловероятно, и всё же.

gun_dose Jun 16 at 14:58

300 строк можно два часа ревьювить разве что только если код написан на незнакомом для ревьювера языке. Если же там настолько витиевато написано, что невозможно понять ни с 3, ни с 5 раза, то любой ревьювер говорит "перепиши это место нормально". Независимо от того, написан этот код человеком или ИИ. Я не спорю, есть такие люди, которым действительно надо час думать, чтобы понять 100 строк кода. Но как правило, такие люди оказываются на месте ревьювера не из-за опыта, а из-за стажа.

nuclight Jun 16 at 17:52

Незнакомый язык - это фигня. Вот незнакомый алгоритм, или подсистема с хитрыми взаимодействиями, да еще где-нибудь в ядре, запросто могут потребовать просчета взаимодействий с соседними, особенно с точки зрения security, и т.д. Я понимаю, что перекладывальщики JSON-ов с таким не сталкиваются, но индустрия к ним не сводится, и нет, это обычно как раз значит, что место написано нормально и переписывать его в индусский код не нужно.

gun_dose Jun 18 at 07:42

security

Совсем забыл про эту отмазку на все случаи жизни. Почему так долго делал? - Безопасность. Почему нельзя сделать нормально? - Безопасность. А как спросишь по делу, мол давай расскажи, какие именно риски проверялись, так всё, ни бэ, ни мэ, ни кукареку

LeVoN_CCCP Jun 8 at 14:54

Но конечно всё зависит от модели /s

andrey_yasko Jun 9 at 03:51

Я раньше тоже был сильно против использования нейронок при написании кода. Но со временем понял в чем они реально полезны. Они позволяют внедрять функционал в малознакомом стеке минуя дни раскуривания тонн документации (да и попутно гораздо быстрее обучая основам этого стека). Например какой-нибудь бородатый легаси-код или допиливание опен-сорсных информационных систем. Т.е. для опытного программиста, который пишет на своем знакомом фреймворке/языке, нейронка как пятое колесо. Но для того же программиста, который понимает паттерны и архитектуру программ, но просто пока не шарит за синтаксис и специфику конкретного инструмента - это хорошее подспорье для решения срочных задач.

DoubleS Jun 10 at 01:56

А мне кажется, что, как раз, у "среднестатистического человека" усилий уходит меньше, так как он воспринимает любое решение ИИ-инструмента как магию, он не думает о качестве кода, его избыточности и применении лучших практик, поэтому и дебажить не приходится, так как просто нет экспертизы и понимания, что что-то не так. А вот у специалистов, коим является сам автор, ввиду профессиональной деформации, в голове сразу выстраивается дерево метрик и пайплайны для проверки, и чем они "фундаментальнее", тем выше затраты когнитивного ресурса. Спасибо за статью!

Furriest Jun 11 at 03:55

неужели я один такой глупый и не умею/не хочу пользоваться отличным инструментом для упрощения работы?

Нет, конечно, вы не один.

Но массовость неумения пользоваться инструментом не означает ничего, кроме массовости неумения пользоваться инструментом.

Manwe_SandS Jun 13 at 09:15

Когда менеджеры требуют от программистов обязательного использования ИИ – это как если программисты начнут требовать от менеджеров ходить на переговоры на высоких каблуках. Каждый должен заниматься своим делом. А если человек, не разбирающийся в профессии, насаждает какие-то техники – ничего хорошего не жди.

Тут на Habr уже писали в комментариях: одни программисты считают, что ИИ улучшает качество кода, другие – что ухудшает, правы и те, и другие. По мне, так если ИИ ускорило именно написание кода, значит программист просто медленно пишет код. Может быть ему ИИ и поможет. А тем, кто пишет код быстро, ИИ только замедлит работу. Лечить надо то, что болит. Здоровых лечить не надо, это бред.

Проблема в том, что менеджеры наслушались инфоцыган, обещающих золотые горы от внедрения ИИ. Такое уже было с блокчейном 10 лет назад – тоже менеджеры носились и требовали срочно придумать как внедрить блокчейн в продукт.