Комментарии / Профиль diflux / Хабр

diflux@diflux

Пользователь

ПрофильСтатьиПостыНовостиКомментарии14

Senior на бумаге, Junior в рантайме: как я тестировал локальные LLM на 120B параметров в Greenfield-проекте

diflux 4 мая в 17:41

так это уже давно, просто некоторые просят шифроваться стилем написания и не бросаются в глаза, как эти пункты.

Senior на бумаге, Junior в рантайме: как я тестировал локальные LLM на 120B параметров в Greenfield-проекте

diflux 29 апр в 19:01

Что могу сказать: я второй месяц собираю автономного агента на локальных LLM, в которого можно закинуть идею, а он сам бы её исследовал, расписал, согласовал, разбил на задачи и реализовал. На текущий момент Qwen 3.6-27b для агентских задач — самая продвинутая из доступных для моей 3090Ti локально. Но это всё ещё далеко от качества облачных решений типа Composer 2.0.

Хочу дополнить резюме автора своим наблюдением: одного Reviewer Agent недостаточно.

Без жесткой архитектуры это превращается в бесконечный цикл «отклонение → переделка → отклонение», который никогда не закончится, пока не иссякнет контекст или терпение.

В базе нужна действительно большая модель (уровня Kimi-k2,6), способная удерживать весь контекст проекта, плюс обязательное дообучение (LoRA) под специфические инструменты среды.

Нужен не просто Reviewer, а комплексная система оркестрации, включающая:

Детерминированный роутинг сценариев: Четкое разделение на роли (Архитектор, Инженер, Тестировщик, Дебаггер и тд), где каждая роль имеет свои права доступа к инструментам и лимиты итераций.
Верификатор как внешний арбитр: Механизм, который не доверяет словам модели, а самостоятельно запускает тесты/линтеры и принимает решение о статусе задачи (done/blocked) только на основе объективных доказательств (DoD).
Safety Kernel и Loop Guards: Жесткие ограничители, которые прерывают цикл после N неудачных попыток и автоматически эскалируют задачу на человека или меняют стратегию (например, переход от «попытки исправить» к «перепланированию»).
Память проекта в виде артефактов: Хранение контекста не в чате, а в версионируемых файлах, чтобы агент мог обращаться к истории решений, а не галлюцинировать заново.
Стратегии сжатия контекста: Автоматическое архивирование старых частей диалога в краткие резюме для освобождения места под текущую работу без потери смысла.
Контур самообучения: Автоматическое извлечение регрессионных кейсов из неудачных попыток для обновления базы знаний системы.
Сквозная индексация: Единое промежуточное представление и граф зависимостей, связывающие код, тесты, требования и правила в единую сеть. Это позволяет агенту видеть влияние изменений (если я поменяю эту функцию, какие тесты и модули затронуты?) и поддерживать трассируемость от бизнес-цели до конкретной строки кода.
Управление блокировками и конкурентным доступом: Механизм блокировки файлов и ресурсов, предотвращающий конфликты записи при параллельном выполнении задач разными ролями.
Бюджетирование и лимиты ресурсов: Контроль расхода токенов, времени GPU и стоимости операций в реальном времени с автоматической остановкой при превышении лимитов.
Мета-тестирование поведения агента: Набор адверсарных тестов специально для проверки устойчивости самой системы оркестрации к сбоям и галлюцинациям.
Объяснимость решений: Визуализация цепочки рассуждений и причин принятия решений прямо в UI (почему агент выбрал именно этот файл?).
Реакция на внешние события: Возможность автоматически создавать задачи в при внешних триггерах (падение CI, пуш в репозиторий).
Версионирование промптов и конфигураций: Хранение версий системных промптов и правил ролей в Git для возможности отката поведения агента при деградации качества.
Ну и там много чего еще...

Как запустить простую нейросеть на своем ПК: гайд без боли, кода, консоли и платных API

diflux 20 апр в 13:59

У меня почему то 2.5 coder не дружит с tool calling. А его с агентом так и не подружил.

Как запустить простую нейросеть на своем ПК: гайд без боли, кода, консоли и платных API

diflux 20 апр в 13:55

3.6 уже выкатили

Я навайбкодил расширение для VS Code, чтобы не вайбкодить с Claude Code (и пример, как вообще нужно разрабатывать с AI)

diflux 12 мар в 16:43

Насколько дешевле курсора вышло?

Я навайбкодил расширение для VS Code, чтобы не вайбкодить с Claude Code (и пример, как вообще нужно разрабатывать с AI)

diflux 12 мар в 12:30

Фишка курсора, что он индексирует до 50 000 файлов проекта для понимания контекста, как вы решили данную задачу? Мне как дизайнеру смотреть в код практически не приходится, всё взаимодействие через чат. Я на node.js собираю веб проект, лежит на домене мастерклик.рф Все лимиты на тарифе ультра этих гиперконтекстных моделей я выжигаю за неделю и основная работа идёт на компоузере 1.5, он видимо безлимитный. Как можно перейти на плагины, я не очень понимаю, так как по API бесплатных токенов не видел.

15 млн. и 10 мес. экономии с помощью Вайбкодинга. Как я создал свой продукт с нуля до релиза. Полный гайд

diflux 8 мар в 08:25

Я тоже навайбкодил за месяц проектик, но не рвусь бежать и писать про это статьи. В чем смысл поста, не понятно. Описанный процесс вообще не похож на тот, который выработался у меня. Все лимиты этих умных гипермоделей я потратил в первую неделю, толку от них никакого, пишут кучу не того что нужно. $200 в плане ультра улетели и оставшиеся 3 недели я дописывал на компоузере 1.5, который судя по всему безлимитный, так как по графику затрат он показывал в районе $800 под конец месяца, то есть далеко за пределами самого тарифа. За этот месяц я собрал дизайн систему с компонентами на дизайн токенах. Интегрировал сторонние сервисы по геокодированию, поисковым подсказкам, отображению карт. Выстроил флоу заказчика и исполнителя. Админку для управления контентом и настройкой. Всякие там адаптеры для платежных провайдеров, цели для метрики и тому подобное. MVP еще не закончен, но если интересно, лежит тут мастерклик.рф

Чем так хороши Lottie-анимации и почему вам стоит о них узнать

diflux 19 мая 2025 в 08:35

Flash, который сейчас Adobe Animate поддерживает публикацию в html5.

Как спроектировать базу данных регулярного UX-исследования. Полный гайд на примере одного продукта

diflux 21 янв 2024 в 09:01

Я правильно понимаю, что вы вместо того, чтобы изучать и копировать привычные и устоявшиеся паттерны поведения продукта-конкурента, зачем-то еще занимаетесь UX-исследованием и внесением изменений в эти устоявшиеся паттерны на основе ваших тестов?

Как мне кажется, ваша стратегия должна состоять из точного копирования и закрытия по функциональности, а изменения, это перспектива будущего, в зависимости от скорости ваших возможностей по клонированию.

Что первым делают пользователи обновившиеся с 10 на 11 винду? Правильно, идут прибивать кнопку пуск к левому-нижнему углу. Им эти новые механики *** не сдались...

Почему следует отказаться от BPMN

diflux 11 авг 2022 в 18:27

Тоже не вижу причин, описывайте Хаск-модель в формате BPMN, вам никто не запрещает. Если всей команде будет понятно, кто же вас отговорит от этого.

Почему следует отказаться от BPMN

diflux 10 авг 2022 в 22:49

Текущие схемы не понятны не из-за визуальной формы, а из-за информационной неполноты. Графы тоже визуально отображаются в виде DAG-графов, это тоже схемы, просто без циклов. Смысл ioHasC в уходе от функционального описания к информационному, с указанием целей.

В схеме bpmn есть: клиент —> принятие заявки —> регистрация заказа —> принятие оплаты —> доставка —> закрытие заказа.

В ioHasC: Получить данные от пользователя —> Проверить наличие товара —> Получить оплату от пользователя —> Доставить товар

Почему следует отказаться от BPMN

diflux 9 авг 2022 в 18:02

Мне как дизайнеру ваши схемки абсолютно не понятны, (вы их уже привыкли строить, поэтому топите за схемки), но заполнить таблицу последовательности действий я могу и мне это просто. А по фен-шую делается эксперимент, берутся 3 разных бизнес-процесса и описываются разными способами, а потом тестируется понимание на разных пользователях. Сразу уберётся весь судейский субъективизм, с которым мы так боремся в автоматизации процессов :)

Почему следует отказаться от BPMN

diflux 8 авг 2022 в 22:18

Мы используем Хаск-модель Зайцева (ioHasC) весь продукт декомпозируем на информационные графы в логистическом формате, где начало графа — это позиция того что имеем, конец графа — это цель и маршрут — как из А попасть в Б. Я сокращено это назвал АБВ (point A, point B, Way). Такой формат понимают и аналитики и дизайнеры и программисты и даже не имеющие отношение к решению люди, он прост, понятен и универсален, так как в этом формате можно описать любые процессы, алгоритмы, продукты, договора, интерфейсы и тд. Так же ABW является техзаданием, частью бэклога и даже документацией и комментариями к коду и дизайну. Не понимаю, зачем люди себе усложняют жизнь используя чужие методики )))

Как я сделал коллекцию NFT на своей «machine», и быстро выложил на opensea.io

diflux 15 июл 2022 в 16:05

да, пишите в личку