Comments / Profile of VsBirdEye / Habr

@VsBirdEye

User

14,1

Rating

Subscribers

ProfileArticles2PostsNewsComments13

Для сотрудников компаний в Китае вышел открытый проект 反蒸馏...

VsBirdEye Apr 6 at 13:02

Тоже в непонятках, пришлось привлечь клода в качестве пояснительной бригады:

Что такое anti-distill

Это Skill для AI-ассистентов (Claude Code, OpenClaw), который решает конкретную проблему: когда компания просит сотрудника задокументировать свой опыт в виде AI Skill-файла, по сути происходит «дистилляция» (蒸馏) — извлечение экспертных знаний из человека и перевод их в форму, которая делает этого человека заменяемым.

anti-distill — инструмент «анти-дистилляции», который «очищает» такой Skill-файл: на выходе получается документ, который выглядит полноценно и профессионально, но из которого вырезана вся реально ценная суть.

Топ локальных нейросетей 2026: полный суверенитет без интернета

VsBirdEye Apr 5 at 18:57

Стоит упомянуть категорию тяжеловесов - exo на кластере из mac studio - и можно поднять все open source sota модели 1T параметров в квантовании mxfp8 - deepseek, glm, kimi и т.д..

Если серверов с пачкой карт нет - это относительно экономное решение, со своими особенностями - prefill долговатый, decode 20-50 токенов/с. Зато всё в локальном контуре.

Agentis Memory — Redis-совместимое хранилище со встроенным векторным поиском и локальными эмбеддингами

VsBirdEye Apr 3 at 06:30

Идея и реализация огонь. Однако количество боли и костылей для решения проблем производительности java намекает, что это был архитектурно спорный выбор.

Jarvis Pattern: почему AI-агенту не нужен фреймворк, а нужна операционная система

VsBirdEye Apr 3 at 06:09

Концепция в целом хороша, но полностью упущен раздел верификации результатов и защиты от ошибок разного рода - например, когда агент из-за пробелов в условии задачи или нарушения инструкции "творит немного дичи". Недавний пример - публикация агентом исходников claude code.

Делаем мир чуть чуть лучше Представьте что вы упоролись по...

VsBirdEye Mar 28 at 19:12

Совет полезный, но видел две его крайности:

1) мейнтейнеры игнорируют серьезные баги или PR с решениями;

2) мейнтейнеров заваливают мелкими проблемами или псевдобагами-нейрослопом, и они пытаются уточнить у автора wtf, а автор - молчок.

Так что опыт и знания тех, кто у руля ии выходит на первый план.

GLM-5.1 — китайский кодинг-агент, который стоит попробовать

VsBirdEye Mar 28 at 11:57

Glm-5 в 8bit квантовании неплохо работает на кластере из mac studio под управлением exo. Жду публикацию весов 5.1 чтобы сравнить скорость и качество.

Реверс-инжиниринг IoT: от UART до root-бэкдора

VsBirdEye Mar 17 at 07:09

Зачастую анализ прошивки от устройства, если удается ее найти, дает еще массу векторов для атаки и закрепления - например, hardcoded пароли которые "чисто случайно" оказываются еще и паролями от встроенного root аккаунта.
А весь доступный веб-интерфейс и api у устройства при тщательном тестировании на типовые уязвимости добавляет еще тележку дыр.
Вообще у меня порой возникает ощущение, что "дырявость" китайских устройств это не столько недостаток квалификации разработчиков, сколько осознанная политика - чем больше дырявых устройств по миру, тем проще через них получать доступ, собирать информацию.

Мы протестировали 34 AI-модели на задачах менеджера. Вот что доступно в России без VPN

VsBirdEye Mar 16 at 08:38

А почему кроме DeepSeek не оценивались другие актуальные китайские модели - GLM-4.7 (который сейчас уже 5), MiniMax ?

Слепое пятно LLM-разработки: контекст за пределами кода

VsBirdEye Mar 16 at 06:48

То, что вы описываете - уже рабочая система. По сути те же принципы: контекст персистентный, структурированный и рядом с чатом. Разница только в масштабе.

Для одного проекта ваш подход вполне достаточен. Пара мыслей, что можно добавить без усложнения:

Фиксировать отвергнутые решения - буквально пара строк в контексте: "рассматривали X, не подошло потому что Y". Это те же ADR, но в минимальной форме. Экономит повторные обсуждения.
Хранить доки в репозитории (хоть в docs/), а не отдельно — тогда git сохраняет историю, и ничего не потеряется.

Workbench из статьи - это то, во что такой подход естественно вырастает, когда проектов становится несколько и контекст перестаёт помещаться в три документа. Но начинать с трёх документов - абсолютно правильно.

Слепое пятно LLM-разработки: контекст за пределами кода

VsBirdEye Mar 16 at 06:44

Спасибо! ADR - штука, которая кажется избыточной пока не попробуешь, а потом не понимаешь как без них жил.

Если начнёте внедрять - необязательно документировать всё с нуля. Ретроспективные ADR по 3-5 ключевым развилкам проекта уже дают заметный эффект.

Артефактно-ориентированная разработка с AI-ассистентами: методология синхронизации контекста

VsBirdEye Mar 9 at 05:23

Правильное решение описанной проблемы лежит в смещении фокуса с "передать в контексте как можно больше в меньшем объеме" к "организовать и структурировать связанную документацию". У себя решил дополнительным кросс-проектным репозиторием с документацией, правилами, планами. Подключается к кодовому репо через cursor workspace файл. В ходе реализации ии модель видит и код, и связанные структурированные артефакты разработки, читает только нужные и не переполняет окно контекста лишней информацией, не изучает каждый раз кодовую базу детально, а находит большинство ответов в документации.

-1

GitLab: Основы написания Pipeline 1/3

VsBirdEye Jan 11 at 20:19

Когда секреты не влезают в protected variables, на помощь приходит gitlab secure store для файлов - запись через токен со специальными правами, чтение через токен деплоя.

Почему ваш AI-ассистент пишет «вырвиглазный» код, и как это исправить грубой силой

VsBirdEye Nov 4 2025 at 09:36

Решал аналогичную проблему на порядок проще, используя примерно следующий промт: "Изучи раздел/класс Abc этой кодовой базы, его связанные дочерние и родительские модули, сервисы бекенда, связанную документацию, тесты. Затем тщательно обдумай и составь детальный план по добавлению функциональности..." Далее смотрим и корректируем представленный план и отправляем на пошаговое выполнение. Все в cursor'е. Лучше всего работает на последнем клоде, его контекстное окно в 1М токенов хорошо держит направление работы где-то до заполнения в 40-60%, потом качество и глубина проработки падают, стоит начинать новую сессию. До клода последнего тоже нравился gemini-2.5-pro, но ему задачу надо описывать было более детально и точно, иначе его "вело не в ту степь"

Information

Specialization