opium1 июн в 19:55

Год с Claude Code: главное — не он сам, а то, что в .claude/

Средний

9 мин

22K

Искусственный интеллектПрограммирование * DevOps * Python *

Ретроспектива

Из песочницы

+51

Комментарии 66

MountainGoat 1 июн в 21:19

У меня ещё одно правило: общаться с моделью только на английском. В техническом разговоре ломаный английский менее двусмысленен, чем правильный русский. Да и связи между терминами и их концепциями крепче. А то ты ей про паттерн Строитель - она тебе Имхотепа вспомнит.

А вообще имею подозрение, что с правильным промптом и обвязкой даже Qwen всё сможет.

wmlab 1 июн в 22:05

английский, только английский. если общаться на русском в узкой предметной области, к примеру, "возможности AWS Security Hub", модель вот прямо заметно "тупеет". что неудивительно, так как модель тренировали на англоязычном датасете, а русскоязычных материалов, предполагаю, было на два порядка меньше (а то и на три). можно попробовать, наверное, инструкцию "каждый мой пропмт сначала переводи на английский и работай с ним" - не знаю, поможет ли, не пробовал

gerbert_MX 2 июн в 00:18

мне кажется вопрос постановки задачи, на русском надо иначе формулировать уточнять

давно заметил что на русском и на английском приходится по разному промты строить если задача комплексная

только и только на английском "лучше" только с локальными моделями, точнее с ними кодовые агенты реально тупее если ставишь задачу не на английском, а вот кодекс/клод уже давно выше этого и прям заметного падения качества от языка я не заметил

amazingname 2 июн в 05:58

В кодинга агент всегда повторяет ваш вопрос на английском переформулируя его а потом обсасывает на английском со всех сторон. Я 3 месяца писал на английском, потом перешёл на русский и прилично ускорился. Потому что я русский знаю лучше, а агенту пофиг.

opium 2 июн в 03:17

Спокойно можно привет на русском уже давно, пишу только на русском, успех 99 процентов. В свое время для английский давал буст , сейчас он стал таким маленьким что его не видно

3aky 2 июн в 13:09

Если общаться на русском, то и он переводит на английский, и каждый из подключаемых инструментов наверное тоже. Лучше, как мне кажется, попросить его показать на английском- что он понял, и ужемхто запускать, а пресеты и прочее - желательно изначально английскими делать.

opium 2 июн в 13:14

Вообще не так, пишите на русском и будет всё отлично

3aky 2 июн в 13:19

Я и так и так пишу - любопытно же. Гуглевские инструменты пока переводят и это видно в логах, подозреваю, что остальные зачастую тоже.

Glen5 2 июн в 04:51

Есть мнение, что это не английский более точен, а вы менее требовательны к своему тексту на английском, чем на русском. На родном языке вы читаете сформулированный текст и можете представить тысячу подсмыслов, а в английском, без культурного бэкграунда, все кажется прямолинейным.

opium 2 июн в 04:52

ну на практике такого не вижу , так что это скорее надуманная проблема чем реальность, вы в клод коде или кодексе испытываете такую проблему со смыслами ? как по мне там всегда все однозначно

Glen5 5 июн в 13:10

Я, честно говоря, не вижу разницу в результатах работы клода в зависимости от языка. Но зачастую замечаю, что мне проще написать на английском, чем пытаться сформулировать на русском. И я рефлексировал на эту тему: либо сказываются сотни часов чтения на гитхабе и соответственно легче формулируются технические вещи на этом языке, либо, как я предположил выше, это самообман и в русском запросе я просто больше требователен к своим формулировкам.

opium 5 июн в 13:19

Ну просто раньше я писал на английском так как результат был сильно лучше , но эти времени давно прошли

mahmud90 2 июн в 05:35

с правильным промптом и обвязкой даже Qwen всё сможет.

Пользуюсь Qwen Code + qwen3.6-plus, план модель всегда составляет сама, без дополнительных просьб и напоминаний, свои тесты тоже запускает и ошибки в них смотрит сама (без всяких хуков), поиск по проекту быстрый и точный, внесение любых правок или запуск команд только после ручного подтверждения, не нужно отдельно прописывать это. Пользуюсь не так давно, в целом модель кажется довольно умной, с поставленными задачами справляется. Конечно в любом случае все проверяется вручную. Использую не по максимуму и не каждый день. С Opus, Gemini, GPT не сравнивал, но пока не вижу смысла переплачивать за более дорогие модели.

opium 2 июн в 05:59

Ну хочу вас огорчить там сильно хуже к сожалению, мульти агент на клоде плюс кодек плюс гемени в разы лучше

mahmud90 2 июн в 06:11

Вот прямо в разы?) А что по соотношению цена - качество?

qwen3.6-plus на довольно сложном проекте нормально справлялся с поставленными задачами. Возможно, есть модели получше (которые в разы дороже). То что они лучше "в разы" - сильно сомневаюсь.

opium 2 июн в 06:20

Да , ну как бы а зачем мне гнилые яблоки если я хочу хорошие, анлимные подписки пока стоят копье к нашему счастью когда они будут стоит по несколько тысяч в месяц тогда да , будет иметь какой то хоть смысл морочиться с этим , а пока почти даром раздают то вообще нет смысла переживать

mahmud90 2 июн в 06:27

Правильно ли я вас понял, что вы сравниваете китайские модели с "гнилыми яблоками" и утверждаете, что Opus, Gemini, GPT в "разы лучше"? Какие-то пруфы есть, или просто субъективщина на уровне "каждый кулик свое болото хвалит"?

opium 2 июн в 06:34

Да модели все популярные мы постоянно тестируем в своих флоу и смотрим что лучше и хуже, благо это очень легко автоматизируется ну и я думаю многие публично выкладывают тексты моделей и не проблема их нагуглить

mahmud90 2 июн в 07:00

Ок, вот два первых результата из гугла: раз и два. Никакого преимущества "в разы" даже близко нет, пишут даже что qwen3.6-plus лучше в каких-то аспектах. Если у вас есть ссылки на тесты моделей где qwen3.6-plus хуже "в разы" - напишите.

opium 2 июн в 07:14

ну так видимо вы просто не понимаете в итоге что получаете , смысл в прохих решениях? если можно за копье иметь лучшее решение на рынке. Из простого доволдьно много задач они не могут сделать от слова совсем это про китайские квен кими минимакс и прочие , то есть если оно не может сделать часть задач которые делает связка из агентов кодекс клод гемени , зачем они вообще нужны ? пока подписки стоят при копейки вообще нет смысла на грамм проседать в качестве и отсутствии решений, время стоит все равно дороже

mahmud90 2 июн в 07:36

Из простого доволдьно много задач они не могут сделать от слова совсем это про китайские квен кими минимакс и прочие

первый раз встречаю такое утверждение) ну и тесты говорят об обратном. В моем случае квен с поставленными задачами справляется, в большом проекте разбирается без проблем.

связка из агентов кодекс клод гемени стоят копейки

$200 в месяц + гемини + гпт - копейки? Ну ок.

В любом случае ваше право, конечно, чем пользоваться. Я лишь поделился в комменте своим опытом.

opium 2 июн в 07:50

ну вы попробуйте сделать одинаковые задачи всеми иишками и увидите разницу, я часто так гоняю их

TemArtem 2 июн в 13:13

Квен реально подтянулся за последний год. Для рутины его хватает с головой, и стоит он копейки по сравнению с антропиком

opium 2 июн в 13:14

Так антропик стоит копьё

TemArtem 2 июн в 13:06

Раньше так и было, сейчас модели уже нормально русский понимают. Главное логику задачи внятно описать, а не язык выбрать

gerbert_MX 1 июн в 21:21

что-то гложут меня сомнения, что такая массивная структура чем-то помогает, а не просто забивает контекст

с агентами сейчас чем лаконичнее и понятнее тем лучше, потому как большой объем кроме контекста еше и точек двойственного толкования добавляет. А клод сейчас и так поглупел, забывая кусками правила почти сразу

vrnvorona 5 июн в 12:58

Поэтому и надо использовать хуки, агентов с разным контекстом и дергать скиллы/команды/mcp точечно. Закидывать все - чушь и не работает. А вот иметь "пайплайн" очень даже работает.

zakarov 1 июн в 21:52

Хук я бы чуть поправил. run_bot_tests.py при падении pytest печатает в stderr и делает sys.exit(0). Т.е. PostToolUse делает "увидел ошибку - попробовал починить". Но tool call уже прошел, файл уже изменен.

exit 2 у PostToolUse не откатывает действие, а только скармливает ошибку обратно Клоду. Если нужна именно защита от мусорного результата, ее надо вешать на Stop/TaskCompleted или тащить в pre-commit/CI.

opium 2 июн в 03:18

Это относительно старая статья, тут уже большая часть всего переписана, не переживайте.

Diamon33 2 июн в 19:45

А зачем здесь относительно старая статья, если всё уже переписано?

opium 3 июн в 04:08

Ну потому что раньше переписывали все два года, сейчас два дня, пока статья висела на модерации и в песочнице прошло времени вагон

Diamon33 3 июн в 21:56

Это здорово, но на вопрос не отвечает

opium 4 июн в 03:11

ну написал статью , так как хабр не быстрый пока прошла модерация, потом в песочнице ждала пока одобрят, прошло несколько недель, за это время понятное дело уже и флоу поменялись и код обвязок и прочее.

Если раньше я там писал статью и она годы была актуальна, сейчас зачастую через неделю бывает проект полностью переписан с нуля.

Diamon33 4 июн в 19:19

Я и говорю - это отвечает на вопрос "почему" на Хабре неакутальная статья, и спросил - а "зачем"? Если модерация не успевает к актуальности, что Вы, собственно, хотите по устаревшей статье обсудить-то?

opium 5 июн в 03:43

а смысл это спрашивать у меня , не я модерирую , не я делаю апрув в песочнице. ситуация такая прихожу утром за свежим хлебом там очередь на весь день вечером беру ну такой честно уже черствый хлеб, а вы спрашиваете , а че свежий то не взял. Ну а у меня глаза на лоб

Diamon33 5 июн в 03:45

Видимо, придется задать совсем прямой вопрос - как смотрите на то, чтобы снести неактуальную статью, вместо того, чтобы обсуждать в ней неактуальный материал, и запостить ту новую, где уже всё исправлено?

opium 5 июн в 04:02

Это не так работает, я уже купил хлеб, если снесу статью потеряю инвайт на хабр. Ну и завтра я куплю свежий хлеб не переживай, будет что обсудить

jlllk 2 июн в 03:15

Сейчас перед архитектурным вопросом я даю модели:
- характеристики нагрузки (сколько запросов в секунду, объём данных, как часто читают/пишут)
- стек и инструменты, которые уже стоят
- историю проекта — на каких решениях обожглись, что не используем принципиально
- кто будет сопровождать это после меня

Или пример неудачный, или я что-то не понял. Если знать ответы на эти вопросы, то решение само должно родиться в голове. Уже проделано 90 процентов работы.

opium 2 июн в 03:20

Ну если брать какую нибудь задачу не сильно сложную, я её делаю неделю зная ответы выше. Какой нибудь кодекс ее делает за 5 могут моего времени если все удачно сложилось. Тут просто скорость работы на порядок отличается на выходе

TemArtem 2 июн в 13:09

В том-то и суть, что архитектуру придумываешь ты, а кодогенерацию спихиваешь на железку. Сам подумал, машина напечатала, профит

opium 2 июн в 13:13

Да все придумывает машина под ключ

jlllk 2 июн в 03:22

Подписка Max — это две тысячи долларов в год. Сильно. Если бы я не использовал Claude Code — мне было бы за неё обидно. Так — нормально, по часам отбивается.

Поясните, пожалуйста, как именно отбивается? Берете больше работы, за которую больше платят?

Меньше тратите на работу и больше отдыхаете?

opium 2 июн в 03:23

Оба пункта работают

vrnvorona 5 июн в 12:58

Платит компания которой выгодно ускорение даже на 5%

K0styan 2 июн в 04:01

первое сообщение в новой сессии писать на полтора абзаца с контекстом

А не пробовали это самое первое сообщение для сессии генерить моделью же, напоследок перед закрытием предыдущей?

Я стараюсь длинные сессии финализировать сводкой в файлик - это даже мне помогает контекст восстанавливать)

opium 2 июн в 04:11

а зачем ? если вам надо восстановить контекст он есть в нужных мдфайлах в общих чертах, если надо полностью просто через резюм и у вас полностью идентичный контекст для продолженния работы , ну и в целом ии работает в скрине и не теряет контекст во время работы от слова совсем. Тут к сожалению вы предлагаете лишнюю работу делать которая не нужна

vrnvorona 5 июн в 14:03

Слишком длинное контекстное окно делает работу моделей хуже, а compact не всегда хорош. Качественные handoff или же фиксация через спеки это залог хорошей работы с ИИ

opium 5 июн в 14:23

Не вижу такой проблемы явно, каждый раз подгружать из мдфайлов сотни тысяч токенов контекста нет это все сильно ломает флоу и удорожает работу

Сейчас везде контекст больше 200к и выгоднее финансово просто на нем и работать плюс субагенты могут юзать форк то есть не подгружать конктекст гигантский их файлов в юзать контекст родителя это все в совокупности даёт большой буст в скорости и цену так как ваш контекст уже закеширован на стороне апи, там и цена падает в разы и скорость растет.

Ваш флоу был супер актуальным и я на него молился когда у всех контекст был 100-200к, сейчас увы у всех 1кк

vrnvorona 7 июн в 21:00

Несмотря на максимальный лимит контекста, чем он больше занят тем нейронки хуже работают, полно бенчмарков показывающих это. Opus 4.7 вообще сильно регресснул между 4.6 и 4.8 и сильно потерял в context retrieval.

Согласен с сабагентами для того чтобы не забивать контекст основной, это хороший подход. Но если чат уже забит зачастую имеет смысл его почистить.

opium 8 июн в 05:54

вообще глобально не имеет смысла , если он переполнится он сам сделает компакт , тут проблема такая что он же автономно работает , а ручками что то чистить это уже доп ручной труд, + любая новая задача начинается с 0 контекстом

BasilM 2 июн в 04:43

К статье Claude явно тоже "приложил руку". "Самое чистое попадание", "тут самое точное попадание", "слепая зона"... чисто клаудовские оборотики. Ну или это артефакты перевода с английского и, возможно, все модели этим грешат.

opium 2 июн в 04:51

Не это человек такой )) проф деформации

dimas846 2 июн в 05:29

Могу рассказать про свои skills. Стэк: PHP (Symfony). Понял, что удобно делать скилы под процессы и под компоненты.
Например сайт мультиязычный и надо выводимые строки оборачивать методом переводов. В конце "собирать" новые переводы консольной командой в файлы yaml и в этих файлах переводить строки на конкретные языки. Так вот этот процесс описан в скиле, и Claude его использует когда что либо поменялось в UI.
Есть на сайте datalists такие сложные таблицы с фильтрами, сортировкой, пагинацией и т.п. Этот сложный компонент и когда надо создать новый datalist или изменить существующий - используем подробное описание его паттернов и архитектуры с примерами из скила.

Хуки пока не использовал, надо почитать про них..

Vest 2 июн в 07:28

Я делал небольшой проект для себя, и там я использовал самый популярный скилл для Реакта (не знаю, дало ли это что-то, я сам плохо его знаю), MCP для Chrome (эта штука меня впечатлила) и недавно узнанный codegraph. Последний, к сожалению, не идеальный, но выручал меня в плане скорости.

johnnyBoy1984 2 июн в 09:10

спасибо что поделились опытом, очень интересно что у вас в mcp-builder и document-skills:xlsx/pdf/docx ? можете поделиться или хотя бы кратко описать?

opium 2 июн в 09:24

https://github.com/anthropics/skills/tree/main/skills/mcp-builder

Для элементов можно вообще без скилов работать если у вас нет какого то стандартного флоу и вы не делаете одни и те же документы много раз, сейчас ии читает и создаёт их из коробки не нужны приблуды как раньше

TemArtem 2 июн в 13:02

Подход с контекстом правильный, машина без вводных всегда выдаст сферического коня в вакууме. Только поддерживать эти талмуды в актуальном состоянии та еще морока - забудешь обновить доку и он тебе нагенерит кода по старым стандартам

opium 13 июн в 13:30

она сама обновляет доку слава богу

Lord_of_Rings 2 июн в 16:02

я использую Claude Code на максимум. Не «иногда», не «когда подходит» — постоянно, на каждой задаче.

В том числе на Хабре Q&A, вводя пользователей в заблуждение.

opium 13 июн в 13:30

там не использую клод код там другое сейчас

d3d14 2 июн в 17:55

Новая сессия = новая голова. Если на следующий день вы продолжаете задачу — дайте контекст явно, первым сообщением.

У вас разве сессии не сохраняются?

opium 13 июн в 13:29

глобально не использую ничего кроме последней сессии, они всегда работают в скрине и сказать честно если раньше я тыкал резюм постоянно, то сейчас раз в месяц

Ryav 2 июн в 18:29

MCP к Telegram

Это какой? Что-то я ни одного зрелого MCP не встречал для Telegram.

opium 13 июн в 13:27

сами написали себе

Diamon33 2 июн в 19:43

Сразу важная оговорка: я использую Claude Code на максимум. Не «иногда», не «когда подходит» — постоянно, на каждой задаче.

два MCP-сервера

Cool story, bro

Подписка Max — это две тысячи долларов в год.

$2400, annual же есть только на Pro, не?

Перед рискованными мерджами я прогоняю изменения через другую модель — Codex от OpenAI.

Это бесплатно досталось?

Skill — это упакованная экспертиза

Т.е. все ещё prompt-preset, т.к. кроме текста мы на ввод ничего не даем.

if result.returncode != 0: print(f"Tests failed:\n{result.stdout[-1500:]}", file=sys.stderr)

Т.е. после каждого редакторования файла, даже просто добавления коммента - вы решили наливать в контекст stderr ?

P.S. Что за манера пошла в статьях выделять слова везде где ни попадя? LLM статью писала?

opium 13 июн в 13:28

2к +-

да почти бесплатно там вообще три копейки стоит все

там в коде уже все давно поменялось

нет не лмм, просто правил плохой редактор

Зарегистрируйтесь на Хабре, чтобы оставить комментарий