Обновить
4K+
372
Alex Efros@powerman

Software Architect, Team Lead, Lead Go Developer

7
Рейтинг
207
Подписчики
Отправить сообщение

Ну, пример с TLSMode несколько натянутый, спорить не буду. Идея была в том, что в этом кейсе значение (true/false) по умолчанию может быть любым (напр. зависящим от каких-то других факторов), поэтому его требовалось явно отделить от форсированного пользователем true/false.

А что не так с bool? Если значение по умолчанию это false, то всё работает само собой. Если значение по умолчанию это true, то да, становится неудобно, но это решается переименованием поля так, чтобы изменить смысл на обратный и значением по умолчанию стал false.

А как Вы заставите коллег не писать плохой код руками? Точно так же и с вайб-кодерами.

Есть процесс ревью (людьми), есть история того, как коллега "игнорировал" замечания с прошлых ревью или документированные требования проекта/компании повторно совершая те же ошибки - и причина по которой он "пишет плохо и не обучается" совершенно не важна, как и используемые им инструменты.

Когда о необходимости регулирования начинают говорить аутсайдеры - им нужны понятные правила игры. А когда лидеры - им нужна возможность эти правила задавать для других.

Амодеи напоролся ровно на то, за что боролся. Он хотел регулирование - он его получил. Правда, он явно думал, что регулировать поставят его, и регулировать он будет конкурентов, но… не свезло.

Конечно же, настройки там есть, и их море. Да, сейчас оно уже из коробки без настроек работает, и весьма неплохо, но тот же MTP нужно включать ручками, и не только - тюнинг ещё штук 8 опций весьма значительно сказывается на производительности.

Чтобы упереться в 5-ти часовой лимит у меня уходит 1.5-2 часа на Opus - это примерно до 5 запросов, иногда успеваю одну задачу сделать, но далеко не всегда. Про Fable вообще говорить нечего - 3 запроса и привет лимит. Да, задачи у меня сложные, контекста относительно много набегает за одну такую сессию (под 200K), но эти модели и нужны для сложных вопросов, простые за копейки делает DeepSeek V4 Flash.

Если не ошибаюсь, разница DeepSeek V4 Flash и Sonnet не порядок - а два порядка. А разница в качестве, на глазок, процентов 15. Я из-за этого вообще перестал Sonnet использовать - на подписке Pro лимиты жёсткие, так что либо Opus/Fable для архитектурных вопросов, либо DeepSeek V4 Flash для "набрать код".

Та проблема, которую Вы описали - вполне реальна.­ Но это не единственное, что существует в этом мире, помимо этого есть и другое. Например, качество генерации LLM сильно зависит от того, кто с ней разговаривает и как он это делает.

Если попросить LLM "напиши статью на хабр про X" - наверняка будет мусор (хотя лично я не проверял, но вроде это очевидно). А вот если несколько часов общаться с LLM обсуждая сложный кейс, пройти в процессе несколько осознаний обоим участникам этого обсуждения, а потом попросить написать статью про этот кейс - качество результата будет принципиально на другом уровне. А если после этого вручную сделать серьёзную редактуру, то от собственноручно написанной статьи отличить станет сложно даже "автору". Если работать в таком стиле, то LLM из "автора нейрослопа" превращается в "очень быструю печатную машинку" - ровно та же ситуация, что и при написании кода, когда ты либо в браузерном чате просишь "напиши мне код для фичи X" либо тот же запрос отправляешь агенту, который имеет доступ к коду проекта, получил море контекста из AGENTS.md и обвешан скиллами "как делать X правильно". В первом случае будет фигня, во втором не всегда можно отличить код от собственного.

У меня это только терминалы. При запуске можно задать уникальный идентификатор/имя приложения/окна, по которому оно автоматически попадает на нужный виртуальный десктоп. Напр. foot --app-id=… и urxvt -name ….

Я в 2001 сделал свой дистрибутив на базе LFS и сидел на нём (вместе с несколькими друзьями) 2.5 года, потом ушёл на Gentoo, и с тех пор ни разу не переустанавливал ОС - зачем мне уходить с Gentoo? Чтобы каждые пару лет осваивать изменения в новой версии убунты? И нет, хакером я себя не считаю, я разработчик - просто мне для комфортной разработки нужна удобная, надёжная и безопасная среда. (С безопасностью стало хуже после того, как Gentoo Hardened умер, но до этого много лет радовала и она.)

У меня уже… хз сколько, больше 20 лет наверное всегда ровно 24 виртуальных десктопа, с переключением по Alt-Fx и Alt-Shift-Fx. В 23 из них одно приложение, открытое на весь экран, без рамки окна, запускаемое в заранее заданном виртуальном десктопе при запуске DE (в результате все эти годы одна комбинация всегда переносит меня в браузер или мессенджер или почту etc. - сами браузеры и мессенджеры за эти годы менялись, а вот какой кнопкой я в них переключаюсь - нет), а 24-й оставлен на случай если мне понадобятся редко запускаемые оконные приложения (gimp, steam, etc.). О! Я в 2007 на хабре про это уже писал: https://habr.com/ru/articles/13051/

1. CLAUDE.md до 8к символов, остальное в отдельные файлы

Ещё важно чтобы эти отдельные файлы модель читала когда нужно и не читала когда не нужно - и это обеспечить уже сложнее.

2. .claude/settings.json — три настройки которые меняют процесс

Пустая трата времени.

Безопасность дают исключительно бэкапы плюс песочница (и не встроенная в Claude Code, а внешняя), ограничивающая доступ агента исключительно файлами проекта и секретами, которые явно прокинули в песочницу. В этом случае худшее, что может устроить агент - удалить файлы проекта (но тут есть ежедневный бэкап) или что-то пушнуть на гитхаб в рамках прав выданного ему токена. Когда это есть, то: claude --dangerously-skip-permissions.

3. acceptEdits — включать выборочно, не глобально

Пустая трата времени.

Намного продуктивнее запретить в AGENTS.md делать коммиты без ревью пользователя, после чего дать модели возможность написать рабочий код проходящий тесты, а уже потом этот код смотреть. Так получается в разы быстрее, потому что не тратится время на ревью промежуточных полурабочих вариантов и ручные подсказки модели для исправления ошибок, который она бы и сама исправила получив обратную связь от линтера и падающих тестов.

4. Hooks как guardrails — три которые работают

Блокировка опасных команд - это театр безопасности, модель всегда это может обойти.

А вот уведомление при получении ответа - да, это QoL фича. Только у меня оно звуковое.

5. Multi-model council для архитектурных решений

Если это встроенная фича, то я такую не нашёл пока. Но вручную так делал. Иногда действительно польза есть, но редко.

Зато я недавно нашёл фичу /advisor и включил потестить. В результате Opus начал ходить к Opus за консультациями (автоматически, по собственной инициативе). Очень забавно за этим наблюдать, но важнее то, что результаты этих консультаций показывают, что как минимум в половине случаев он не зря ходил.

6. Параметры усилий — глубина под задачу

(Тут я не из собственного опыта, так что не могу гарантировать корректность.) Есть мнение, что Opus на medium хуже, чем Sonnet на high. Хуже, но дороже. С другой стороны, Opus на xhigh - как-то уж очень дорого. Поэтому если задача сложная-архитектурная, то Opus на high, а если не сложная или по уже составленному Opus плану - то… DeepSeek V4 Flash. :)

7. Context Rot — распознать и перезапустить вовремя

В целом верно, я раньше тоже так делал. Но в последнее время я перестал тратить своё время на подготовку резюме прошлой сессии - либо прошу его подготовить самого агента, либо тупо /compact и качество ответов восстанавливается само.

8. Правило двух коррекций

По моим наблюдениям, особенно если мы говорим про Opus и модели сравнимого уровня, то это упрямство означает то, что модель иначе видит позиционирование проекта/цель текущей задачи и т.п. расхождение в целеполагании. Очень хорошо лечится добавлением таких "философских" пояснений в AGENTS.md. Иногда в процессе уточнения сам начинаешь, наконец-то, понимать, о чем, на самом деле, текущий проект. :)

А вот с более слабыми моделями - да, нужно декомпозировать или давать примеры.

9. Sandbox mode — разные настройки для разных окружений

Театр безопасности.

10. Skills для lazy-loading специфичного контекста

Да, скиллы - бомба. Особенно если модель верно понимает, когда какой скилл грузить.

Вы просто не поняли смысл, для чего нужно настраивать систему "под себя". Нет, не для фоновых картинок, не для красивого индикатора погоды, и даже не для автоматического переключения настроек при подключении к другому монитору.

Настройка нужна для того, чтобы убрать препятствия. Когда Вам нужно что-то сделать по работе - переключиться из IDE в браузер, или запустить тесты в терминале, или открыть тот файл и строку на которые указывает ошибка, или удалить текущую ветку в гите и подтянуть результат её мержа на гитхабе в основную ветку - в общем, в тот момент когда Вы подумали "мне нужно X" - этот X должен произойти, причём максимально быстро и гладко, чтобы не сбивать Вас со следующей мысли. А если Вы подумали - нажали Alt-Tab - и… оказались не там, где хотели оказаться, то в этот момент мысль сбивается и начинает думать о совершенно посторонних вещах: сколько ещё раз надо нажать Alt-Tab, а почему нужного окна тут не оказалось хотя я был уверен что оно следующее в очереди, … и всё, на этом рабочий поток оборвался. Если открывая часто используемое приложение Вы каждый раз слегка "спотыкаетесь" взглядом о некрасивый шрифт, если работая с кодом Вам регулярно приходится тратить время пытаясь всмотреться в символ, который то ли "O" то ли "0", если нужное приложение тормозит, и т.п. - всё это мелочи, но именно эти мелочи сбивают с рабочего потока. И поэтому - да, это влияет на продуктивность, и довольно заметно.

Но есть и вариант, в котором Вы будете правы. Например, если продуктивности нет. Рабочего потока нет. Есть неинтересная работа, выполняемая "на отвали", когда хочется на работе делать минимум, желательно не особо напрягаясь. Тут да, любое препятствие воспринимается скорее как желанное отвлечение от работы, а не помеха.

И ещё. Пропавшее желание "играться с компом" и радость от его использования - это симптом. И совсем не обязательно это симптом того, что Вы, наконец-то, повзрослели. Ещё это может быть симптом того, что Вы лишили себя того, что давало радость. Время Вы, конечно, на этом сэкономили, и даже подсчитали сколько именно. Вопрос в том, а на этом ли надо было экономить? Может лучше было бы сэкономить время на чём-то другом, что не давало радости?

Там дело не столько в VRAM, сколько в правильном инструменте и технологии. У меня она выдаёт 34 t/s на 3060 Ti 8 GB - на Вашей карте должно быть заметно лучше, вполне возможно что даже Qwen-3.6-27B потянет.

qwen2.5:9b

Жестоко. На этой карточке можно на приличной скорости использовать Qwen3.6-35B-A3B.

Есть у всех - безусловно. Все строго выдерживают соглашение про дефолты и не забывают делать Clone() - уже не факт.

Но вообще у меня потребность строго описать подход возникла из-за необходимости объяснить ИИ как это правильно делается в SKILL.md, а не потому, что это что-то новое.

А зарубежом будут покупать только "квалифицированные покупатели" через специальные счета или как-бы-крипту из депозитария, что Вы как маленький. Кому надо, чтобы народ свободно покупал зарубежом?

Очевидно, они подразумевают, что хотят денег - неспеша, в перспективе, но хотят. Но никаких денег точно не будет, если их объявят вне закона. А вне закона их объявят гарантированно если они не дадут возможность читать чужие переписки. Впрочем, скорее всего их в любом случае объявят вне закона просто потому, что они полезли на чужую поляну - законы такие, что придраться можно абсолютно к любому человеку, и тем более компании, так что причину/повод найдут без проблем. Отказ RuStore - не столько отказ добавлять именно в рустор, сколько жирный намёк, что нужно переключиться на разработку другого типа приложений.

За 22 года-то? На довольно разном, я же его обновлял, это моя основная workstation. В какой-то момент несколько лет назад сборка начала заметно тормозить, так что пришлось обзавестись достаточно мощным процессором чтобы она не напрягала. Сейчас стоит Ryzen 9 5900X, 32GB RAM. До него стоял Intel Core i7-2600K 2012 года, но в 2020 он компилировал chromium почти 12 часов… так что я сначала просто удалил chromium :) а потом обновил проц. Сейчас самый медленный, наверное, webkit-gtk - часа полтора собирается (но это бывает раза 4 в год примерно).

1
23 ...

Информация

В рейтинге
1 071-й
Откуда
Харьков, Харьковская обл., Украина
Дата рождения
Зарегистрирован
Активность

Специализация

Бэкенд разработчик, Архитектор программного обеспечения
Ведущий
От 10 000 $
Проектирование архитектуры приложений
Golang
Linux
Docker
Безопасность сетей
Модульное тестирование
Наставничество
Разработка ТЗ
Разработка программного обеспечения
Высоконагруженные системы