Pull to refresh
4
0.5

User

Send message

Вот еще один отзыв из интернета.

Ежедневно использую Claude для реальных коммерческих задач. Enterprise-бекенд, от десятков до сотен тысяч строк кода в контексте, в зависимости от сервиса. Opus 4.5 - основная модель для работы.

Использую Augment, и, поскольку его UI тоже навайбкодили, он иногда забывает предпочитаемую версию модели и ставит дефолтную, и сейчас это Sonnet 4.5. Я не всегда это замечаю глазами в интерфейсе, но каждый раз вижу это в производимом коде, причем, как правило, после первой же выдачи. Может быть, кому-то не очень заметно, насколько Опус умнее Соннета, если постоянно использовать второй. Но вот то, насколько Соннет тупее Опуса в обратной ситуации - это просто невозможно игнорировать. Там пропасть такая, что по факту использовать Опус почти всегда выгоднее - он просто быстрее и правильнее делает как надо, за меньшее число проходов и уточнений.

Стоимость разработчика - $100 в час? Чтоб я так жил. Это больше 15к за 20-дневный рабочий месяц, при стандартном 8-часовом рабочем дне.

Судя по тому, как весело горят акции продуктовых компаний, рынок закладывает именно такую вероятность.

Я просил поделиться релевантным опытом по теме, а не ссылаться на других людей, у которых может получилось, а может нет. В комментах к приведенной статье общественность так и не смогла выяснить у автора, "больше половины документов без ошибок" - это сколько именно. Вы работали с этой системой? Поддерживали её, расширяли? Уверены, что с производительностью под нагрузкой проблем не будет, если/когда нагрузка придёт? Или выть "это не остановить" - это подход инженера?

Может, и не остановить. Хорошо бы еще понять, ЧТО не остановить, и обо что нам это встанет. Но лично мне утверждение "я написал, у меня получилось, шайтан-кодинг, пруфов не будет" не объясняет ничего. Поэтому я сузил область до того, что описал в своём вопросе, а критерий - до количества одновременно поддерживаемых сессий агента. Критерий, про который в приведенной вами статье нет вообще ни слова, кстати.

Про пет-проекты плюсую, там, где не упирается в качество кода, упирается в принятие решений по функционалу. На своем пет-проекте я максимум в пару потоков могу, и при том, что в его код я вообще не заглядывал ни разу.

Вот и получается, что упираемся - либо в технические решения, либо в продуктовые (ну, либо и в те, и в те).

Коллеги, практикующие инженеры, поделитесь опытом. Я - senior/stuff level dev, пишу ынтерпрайз-бекенды всякие. ЕРП писал, кассы для ритейла, биллинг, разное, короче. Я не могу себе представить, как я сижу и оркестрирую 10 агентов, каждый из которых хреначит кодом с той скоростью, с которой они хреначат. Не то, что прочитать, а банально по верхам осознать суть предлагаемых решений, как они вписываются в архитектуру, где будут слабые места, что по производительности - это просто нереально. А надо же параллельно думать, чем загрузить следующие 10 агентов, да еще неплохо бы сформулировать им мысли как следует, в спеках и примерах.

Вы тоже чувствуете, что те мифические инженеры в опенаи, которые на постоянку рулят 20 параллельных сессий - ну, натурально, сверхлюди, или для вас это рутина, и главное довериться процессу?

TLDR Банальный нейрослоп + реклама

Насколько же у Антропика хорошие маркетологи, я прям диву даюсь. На фоне того, что они делают объективно лучшие модели для кодинга в мире, теряется тот факт, что их рекламный отдел, в общем-то, тоже творит настоящую магию.

Были у курсора рулы - всем наплевать, ну умеет он подгружать к промпту еще один промпт из файлика рядом - так это ж базовый функционал современных ЛЛМ - соотносить контексты и определять, имеет X отношение к Y, или нет. Для инструмента оркестрации ИИ это настолько базовая функция, что её добавили практически сразу. А до этого люди делали так руками, делились советами, мол, помимо общих указаний давай ссылки на примеры, так лучше идет - все кивали и соглашались.

И тут пришел CC, и сотворил революцию - SKILLS. Глядите, глядите, он сам умеет определять, когда нужен скилл! Они разложены по папочкам, боже ты мой! Невероятно, есть семантика, чтобы рядом положить пример или готовый кусок кода! Что, можно прямо в окне чата вызвать скилл одной командой? Я не верю своим глазам! Как Антропик настолько круто варит хайп - это надо будет потом в учебники заносить.

Уважаемый автор, пожалуйста, хватит. Статей о том, как в инструменте запихнуть кусок промпта в отдельный файл стало слишком много, как только вышла вторая. И ваш нейрослопный плевок с гениальными формулировками типа "чем скилл отличается от MCP" (стыд, чесслово) здесь не нужен ни для чего, кроме абзаца про очередной инфоцыганский телеграм-канальчик, или что там у вас, который вы рекламируете в середине текста.

А если посчитать стоимость токенов на разработку, доработку, поддержку? Сколько стоит аренда инфры? А если нагрузка такая, что базовой впс-ки не хватит? Не подумайте, я фанат селфхоста (да и самонавайбкоженные приложухи у меня имеются), и именно поэтому имею заявить - нифига это всё не бесплатно, особенно когда хочется нестандартную вещь с уникальной и чувствительной к ошибкам логикой. А ведь это мы еще пользуемся демпингом цены на потребление ИИ во имя захвата рынка.

А вот читали бы статью внимательно, увидели бы, что спасение - в анализе информации нейроночками, которые непременно нужно покупать через ботхаб </sarcasm>

Сроки рыночного краха - это штука, подверженная парадоксу наблюдателя. Если они действительно известны, то крах непременно случится либо раньше, от испуга, либо позже, благодаря мерам противодействия. И ждать достоверного предсказания сроков, а уж тем более, внятного плана защиты от куска нейрослопа от рекламного канала - странно.

Интересно подметить, что это уже второй публичный "Умер", мимикрирующий названием под другой известный сервис, и предоставляющий услугу, связанную с темой смерти. В прошлый раз, несколько лет назад, это был русский сервис "Умер" (в утвердительной форме), очевидно игравший на сходстве с "Убером" и, вроде как, являвшийся аггрегатором ритуальных услуг. И тоже вызвавший скандальное внимание, и тоже, не в последнюю очередь, из-за названия.
Матрица иногда забавно глючит, всё-таки.

По сути, современное американское "Собачье сердце" - это правда было бы интересно посмотреть. "И, боже вас сохрани, не читайте до обеда ленту X".

Совсем не обязательно.
90% кода пишет ИИ (допустим, повар нам не врёт, и допустим, что 90% написанного кода == 90% закоммиченного и релизнутого кода - и первое, и второе - достаточно смелые допущения).
Написание кода составляет, дай бог, 30% времени работы инженера.
Освободившиеся 27% времени инженер читает код, написанный ИИ и размышляет, как помирить его с архитектурой, требованиями, теми 10%, которые написаны вручную, и так далее. Читает и интерпретирует логи, оценивает, является ли то или иное поведение багом, планирует последовательность и совместимость фиксов и изменений, договаривается синхронизировать подходы с коллегами. В целом, делает то же самое, что и всегда, только теперь еще тратит время на написание промптов, а это тоже ой как не мгновенно происходит, если подходить с умом.
Ещё можно вспомнить, что ИИ пишет код, конечно, очень быстро, но не мгновенно, и на большой кодовой базе какой-нибудь задумчивый gpt 5 может залипнуть на 10-15 минут, переписав собственный код несколько раз в процессе, поэтому 90% кода, написанного ИИ - не означает на 90% больше кода в единицу времени.
Всё вышеперечисленное способно неплохо так амортизировать 90% строк в какие-нибудь 20% скорости создания инженерных решений, с учетом сделанных допущений.

Слушайте, вам не надоело?
"Gemini программирует операционную систему" в 900 строк кода на JS?
Что такое "полноценная симуляция macOS" и как ей живётся с "псевдотерминалом" внутри?
Автор текста, с какими "сложными взаимосвязанными системами" объемом 900 строк кода вы лично работали, и насколько сложно вам было в процессе?
Когда ребята масштаба Google или Antropic делают пресс-релизы с такими заявлениями, они целятся в колоссальные деньги, которые они сделают на продаже своих лопат. Ради таких денег можно сказать всё что угодно, потому что потом тебе будет уже, в целом, всё равно.
Но вы-то не антропик, вы ботхаб, и вы, конечно, определённые деньги делаете, но стоят ли они того, чтобы позориться, постя такое на технический ресурс?

Между тем, наступил октябрь - а значит, пора 95% кода писать с помощью ИИ, ведь те "полгода" как раз прошли. Иронично, что я пишу этот коммент, пока Соннет 4 безуспешно пытается накодить мне достаточно простой сервер выпуска jwt, и у него не получается вот уже полчаса как. Последняя проблема - забыл, что приложение, которое он полностью написал в этой сессии, запускается в докере. Попытался запустить на хост-машине, удивился отсутствию ноды, ничего не запустил. Отрапортовал, что всё успешно и проблема решена (наврал). Красота.

Новая сверхбыстрая зарядка от BYD восхитительна!

КДПВ отлично иллюстрирует ситуацию. Девочка с горящими глазами наслаивает кубики на невозможную структуру с красивой надписью на ней, и не видит, что значительная часть её творения держится ни на чём. Тот факт, что это сгенерировала нейросеть, заплетает иронию в узел.

Эта замечательная софтина способна ухудшать производительность игр своим присутствием, вызывать подвисания интерфейса вплоть до указателя мыши и ввода с клавиатуры, причем вне запущенных игр, а еще её фиг удалишь - для этого нужна отдельная утилита, которую достаточно сложно найти на официальном сайте и которая не всегда работает (!)

И оно еще и уязвимости не себе несёт. Достойный кандидат в примеры софта, за который авторам надо платить не деньгами, а карательными санкциями.

Ровно в той же степени, в которой вы обладаете правом вещать о кончине целой отрасли на публику. Я не выдал вам ордер на уход из профессии, я ровно в тех же правах, что и вы, отметил, что аргументация вашего посыла хромает на обе ноги.
В прошлый раз вы хотели контр-аргументы. Вот вам два, выжимка моего комментария:
- Не любое приложение влезает в Телеграм, где о безопасности подумали за вас
- Телеграм, как и любая реальная система в реальном мире, не неуязвим, и чтобы вы не думали о безопасности в нем, о ней должны думать люди, которых вы собрались приговорить в вымиранию
Будем конструктивно спорить, или сведем разговор к размышлению о правах друг друга?

Не Телеграм.
Еще раз. Речь не про Телеграм и диалоговых ботов в нём.
Просто поразительно, как виртуозно вы проигнорировали именно тот вопрос, который не позволил бы вам развить своё ну-нуканье.
Иногда кажется, что среди "AI девелоперов" есть отдельная секта людей, для которых современное айти - это то, что либо уже является телеграм-ботом, либо обязательно должно им стать. Оно неудивительно, ведь у нас в руках такой удобный молоток, умеющий автоматизировать диалог. Осталось найти платформу, позволяющую людям вести диалог с этим молотком, и поток гвоздей будет не остановить.
Не думал, что это надо объяснять, но не все приложения подходят для диалоговой модели с ботом. Визуализация данных, дашборды. Работа с документами. Необходимость быстро переключаться между окнами и сразу, одномоментно видеть и держать в визуальном контексте больше информации, чем умещается в окно диалога. Панели инструментов. Да просто логика взаимодействия с приложением, не укладывающаяся в формат "вопрос-ответ". Как вы представляете себе ERP-систему в режиме диалога с ботом? IDE? Фоторедактор? Серьезно, мне правда нужно приводить все эти примеры? Вы правда думаете, что все это станет не нужным, потому что мы можем поговорить с ИИ-ботом?
Я повторю вопрос из моего комментария, который оказался для вас неудобным до невидимости. Что будете делать, если логика работы с приложением не умещается в формат чат-бота? Вопрос, на самом деле, риторический, ответ очевиден: вам придётся разработать программное решение, предоставляющее вам платформу. Сетевое клиент-серверное взаимодействие, авторизацию пользователей, хранение данных, доступность и мониторинг - все те вещи, которые совершенно очевидно первыми приходят в голову любому веб-разработчику (это я вообще молчу, что вебом и разработка, и ИБ рядом с ней стоящая, мягко говоря не ограничивается). Это то, что делали и делают люди в ИТ ежедневно. Это то, что на данный момент невозможно унифицировать под одной платформой с универсальной моделью для всех потребностей. И вот в этих скрытых слоях, о которых разработчику телеграм-бота думать не с руки, и кроются все те черти, которых ловят специалисты по ИБ. Они никуда не уйдут хотя бы потому, что никакого Телеграма не хватит, если вы победите, и всё станет телеграм-ботом.
Ну и да. Телеграм заддосят. Злоумышленник получит эскалацию привилегий через уязвимость, про которую до этого никто не знал. С того устройства, на котором старая версия клиента с особенностями, которые не учли при обновлении бека. Или которое научилось имитировать другое устройство. Телеграм сломают, а устройство подменят. Почему вы так уверены, что это невозможно? Уязвимостей в крупных сервисах мирового масштаба не находили в этом месяце? Уже сам тот факт, что вы так решительно отметаете эту возможность, говорит о том, что про то самое ИБ, о кончине которого вы так уверенно рассуждаете, вы не знаете вообще ничего, начиная с его основных принципов. Разработчики, свято уверенные, что их любимая платформа неуязвима, первыми страдают, когда её таки ломают.
Пожалуйста, идите писать телеграм-ботов дальше. Они тоже кое-где весьма нужны и уместны (хоть лично я и испытываю искреннее отвращение к процедуре заказа чего бы то ни было через чат бота, а не через накликивание нужных мне предметов в UI со списками, картинками и корзиной; ну, да я - миллениал, я устарел для этого мира).
Не лезьте в выводы об отрасли, в которой вы не понимаете ничего настолько, чтобы ну-нукать на тему неуязвимого Телеграма. Это смешно, но только для тех, кто не вынужден работать с такими как вы рука об руку.

Какой-то апофеоз эффекта Даннинга-Крюгера. Ну, или, скорее, просто незамысловатый наброс. В каждом абзаце - настолько смелые заявления, что с них жир течет.
Говорите, админские команды задаются "так же голосом"? Как разграничиваете доступ к режиму админской настройки решения и его использования клиентом? Что, если клиент найдет админские команды?
Переход от одного процесса, обрабатывающего нажатие на кнопку и делающего условный insert в БД заказов к непредсказуемому, излишне обобщенному и, скорее всего, удаленному и разработанному не вами интерпретатору человеческой речи, который в итоге сделает тот же insert через API, подключенный к его второму концу - это, оказывается, "сокращение расстояния между пользователем и полезным эффектом".
Система, задающая промпты другой системе, архитектура которой незнакома в деталях разработчику, которая эволюционирует и меняется независимо от него - это, я так понял, уменьшение количества "заклинаний".
Решение, подверженное тому, что сами его авторы, будучи в здравом уме и трезвой памяти назвали "галлюцинацией" - гораздо проще и безопаснее.

Что будете делать, если логика работы с приложением не умещается в формат чат-бота? Как будете поддерживать авторизацию пользователя, если масштаб приложения вырастет (или изначально будет находиться за рамками) мощностей, предлагаемых платформой наподобие tg, в которой живет бот? Если системе потребуется хранить свое состояние, а не просто общаться с пользователем в рамках сессии, как будете валидировать консистентность хранимых данных? Что с сетевой безопасностью? Как предотвращаются DDoS атаки?

Если вы с серьезным лицом думаете, что ИБшники фильтруют ввод "/admin" в приложение, и избавление их от этой обязанности "сужает их поле деятельности драматическим образом", то, ну, наверное вам не стоит лезть с выводами в эту область - экспертизы маловато.
Если, конечно, это не наброс от "AI developer", чтобы засветить свой титул в еще одной статье.

1

Information

Rating
2,270-th
Registered
Activity