Comments / Profile of vagon333 / Habr

Vasiliy Goncharenko@vagon333

Разработчик

0,4

Rating

Subscribers

ProfileArticlesPosts1NewsComments1.3K

Harness кодинг‑агента: разобрал исходники Codex, OpenCode, Pi и свою собственную

vagon333 Jul 19 at 15:44

Бывают ещё обвязки не для кода вовсе, вроде OpenClaw (мост между мессенджерами и моделями) или Hermes (самоулучшающийся персональный агент), но их с кодинг-агентами лучше не путать, это другой инструмент под другую задачу.

Что скажете по персональным агентам?
Поставил локально Hermes, но пока рассматриваю как игрушку.
OpenClaw - вообще непонятное назначение, с моей точки зрения.

RAG, векторные базы и семантический поиск - это, конечно, классно как начальный вау-эффект, но с ростом объёма данных агент начинает путаться даже при разбивке знаний по экспертам.

Ищу персональный агент с грамотной организацией памяти, раутингом на экспертов и реалиционной структурой знаний у каждого эксперта.

Может, что подскажете из групп разработки или интересующихся ребят?

Замечания по прочтению:

Информации много: слишком сильно вмешался AI, наколбасил чего-то в кучу.
Читать очень тяжело.
Некоторые части, которые должны быть четко структурированы, типа списка Coding Agents, свалены в 1 параграф, убористой набивкой.
Усложняет понимание.
Хорошо бы выделить суть из общего объёма.

Инструкция по секвенированию собственной ДНК в домашних условиях

vagon333 Jul 18 at 05:01

Херассе.

По подсчётам, оборудование на $6,200, за прогон $1,100.
Оно точно стоило того?

Может проще отдать в лабу за 200 долларов?

Как математическая модель победила нейросеть: ректификация документов, сложенных втрое

vagon333 Jul 18 at 04:52

Наш метод превосходит геометрический трансформер DocTr как по скорости, так и по качеству. Его реализация позволяет системе распознавания деловых документов Smart Document Engine успешно справляться с документами, сложенными втрое.

На какую аудиторию рассчитывалась данная статья?

У меня unstructured, semi-structured and structured mortgage banking documents.
Соответственно, нужна классификация и извлечение данных из документов.
Извлечение нужно согласно схемы на каждый документ.

Зашел на ваш веб-сайт, просмотрел вдоль и поперек и не нашёл интересующий меня список возможностей.
Ни цен, ни возможностей, только самопохваление и просьба на каждый чих-пых записаться к вам на приём.

Если Вы рассчитываете на клиентов уровня Газпром, то какой смысл рассказывать здесь технарям про ваши достижения в борьбе со сложенными втрое бумажками?

Qwen 3.6 27b на 8-12gb vram в llama.cpp до 256к контекста

vagon333 Jul 17 at 19:50

... там должно влезть 256к, да еще и место остаться и без турбокванта. Или я что-то не понимаю?

У меня на тестах в 16GB VRAM на RTX A5000 влезло 129К контекста,
а больше: out of memory.

Но, кстати, модели довольно умные.
По моим внутренним 80 тестам лажанулись всего на 6,
да и то при исправленном промпте прошли все 80.
Я заменил свою старую модель на Ternary-Bonsai-27B.

Как установить OpenJarvis: разворачиваем локального ИИ-агента

vagon333 Jul 16 at 14:26

... комфортного удержания контекста в районе 10B+ токенов.

Ну, это вы загнули ... или слишком много доверили генератору текста.

Vera возвращается: как голосовой ассистент превратился в локального AI-агента для Windows

vagon333 Jul 14 at 13:13

Факты автоматически распределяются по категориям:
личная информация;
контакты;
предпочтения;
проекты;
остальные факты.

Не планируете каждой категории свой prompt, модель и структуру данных в SQLite?

В том смысле, что некоторые категории лучше хранить как реляционная структура данных.
Им нужен свой промпт, свой уровень интеллекта, может быть определенный набор скиллов.

LLM говнокодит не хуже людей. Только быстрее

vagon333 Jul 12 at 13:33

Про экзешник не понятно - это какое-то самописное решение?

Да.

Что он делает?

Дает доступ к спецификации репозитория, таскам в Bug Tracking System, отслеживает активность и specification drift, просмотр best practices repository ...
Объем функций растет по мере реализации, потому и написал что в процессе.

Потуги

упрощалка взаимодействия с агентом - выбрал текст, выбрал опцию

автоматически инжектит решение в клипборд с автосабмит (или без)

LLM говнокодит не хуже людей. Только быстрее

vagon333 Jul 12 at 06:16

А вот про Spec Drift Monitoring расскажите подробнее — чем проверяете?

Отдельный экзешник лезет прямо в сессии среды разработки (Курсор).
В новой версии тестирую Курсов в дебаг режиме, чтобы можно было контролировать каждое окно, но мониторинг файловой системы более надежный.

LLM говнокодит не хуже людей. Только быстрее

vagon333 Jul 12 at 01:54

Задачу для AI можно упростить, используя High-Level Building Blocks.

На внутренней разработке и тестировании:
1. Spec-Driven Design and Development;
2. Архитектура на базе Best Practices: репозиторий Best Practices;
3. Набор UI Components вместо Low-Level UI Coding;
4. Spec Drift Monitoring.

LLM говнокодит не хуже людей. Только быстрее

vagon333 Jul 12 at 01:46

Но на одного, кто эти вещи понимает и использует приходится 10, которые этим не заморачивается, и 100, кто даже не знает и гордится этим.

Разгребать после сотни и будет наш хлеб.

Усталость от напарника-машины. Изнанка работы с ИИ-код-агентами

vagon333 Jul 10 at 17:02

Знакомая боль.
Когда я запросил Антропик проанализировать все сессии проектов и выдать рекомендации,
он пожаловался, что 60% моего общения - это матерные frustrations. :)
У меня локальный ASR и все "факи" передаются без авто-коррекции.

За полтора года плотной работы с ИИ, появилась определенная "гигиена".
Например:
- собираемый контекст и факты/выводы, которые делает модель в ходе общения, сейчас черный ящик.
Было бы удобно в рамках каждой сессии видеть набор ключевых фактов, на основании которых модель принимает решения.
- Specification-driven design and development - чем детальнее инструкции, тем более предсказуемый результат.
- отслеживание Specification Drift.
Дополнительный агент должен следить, чтобы исполнителя спецификации не понесло.

JSX для Go: как маленькая разметка потянула за собой рантайм, компилятор и кучу компромиссов

vagon333 Jul 9 at 20:04

Идея интересная, но некоторые архитектурные моменты могут послужить препятствием для adoption:
1. Custom JSX. Я бы рассматривал это как основной шоу-стоппер.
2. WASM - Зачастую пользователям нужно легковесное стендалон решение в одном файле.

Конструктивная критика:
1. я бы не отходил от JSX стандарта.
2. Рассмотрите вариант Standalone JSX Viewer. Размер файла особой роли не играет до тех пор, пока концепция 1 JSX viewer и multiple JSX configurations работает.

Со своей стороны: также создал JSX Viewer и тестирую последние полгода.
Формат JSX не менял, но пользовательский интерфейс строю на UI Framework, то есть из высокоуровневых UI компонентов.
Прямо в JSX Viewer встроил MCP-сервер, к которому можно подключиться из любой среды разработки, типа Cursor, и сказать AI Agent: customize the JSX configuration.
Получилось прикольно - один экзешник и куча конфигураций. Вовнутрь JSX Viewer интегрированы поддержки соединений с разными базами данных, RBAC, Mermaid и другая фигня, которая бывает полезна при быстром прототипировании.

Удачи.

ИИ-роутер, open-source RAG-платформа, СlickHouse-as-a-service и другие апдейты в продуктах Selectel в июне

vagon333 Jul 9 at 15:52

какие самые большие модели доступны и по какой цене?

Было бы удобно иметь полную таблицу доступных моделей с расценками, скоростью и уровнем интеллекта.

что-то типа этого

ИИ-роутер, open-source RAG-платформа, СlickHouse-as-a-service и другие апдейты в продуктах Selectel в июне

vagon333 Jul 9 at 15:18

Представили ИИ-роутер
ИИ-роутер — это единое окно доступа к 300+ генеративным ИИ-моделям.

слегка misleading.
воспринял как agentic AI routing.
Может более точно: "AI API Gateway" ?
Я видел, что у вас уже построена документация на этом термине, но всё равно confusing.

Как я обучил русский RAG‑сплиттер, который режет документы по индексам, а не по тексту

vagon333 Jul 5 at 13:35

Целые таблицы
таблица режется как атомарный юнит, если upstream‑парсер выделил её корректно

А если таблица неприлично большая?

Вопрос не праздный.
Работаю с трансформацией законов.
Попадаются большие и/или вложенные друг в друга таблицы.
Как посоветуете готовить этих монстров?

B4 — сетевой мультитул по обходу блокировок

vagon333 Jul 4 at 21:07

Насчет MCP, я просто не очень понимаю, какой в этом смысл? Ну сгенерит он тебе сет, а при чем тут разработка в ide? Как буд-то более логичная история, это через токены напрячь Иишки подбирать сеты для конкретного сайта в рабочем b4 инстансе, но даже тут возникает куча проблем.

Рассматривай IDE не как среду разработки, а как чат-бот, который может прочитать все возможности конфигурирования твоего сета через MCP, понять назначение каждой опции и сгенерить/исправить Сет.
Сет меняется:
- либо с автоматическим сабмитом в твоё приложение,
- либо с выдачей тебе некоторого файла для импорта вручную.

Рассматривай MCP как API для чат-бота.
Чат-бот может запросить возможности твоего приложения через MCP, получить от тебя задачу в чате и сгенерить согласно задачи и возможностей обратно через MCP новую настройку (Сет), либо подправить текущую или целую группу текучих настроек (Сет).

Browser Extension открывает настройки твоего приложения через бесплатный чат-бот.
Я могу показать чат-бот, который управляет серверами через SSH и работает с базами через сиквельные запросы, но эта задача чуток сложнее.

B4 — сетевой мультитул по обходу блокировок

vagon333 Jul 3 at 15:55

Их есть у меня. Весь этот веб-интерфейс - на самом деле просто клиент поверх REST API. Всё, что вы делаете кнопками, точно так же делается обычными HTTP-запросами. А значит, B4 можно не только настраивать руками, но и встраивать во что угодно своё - скрипты, автоматизацию, мониторинг, свою собственную морду, если моя вам не по душе.

А слабо еще встроить MCP сервер, чтобы можно было создавать 'Сеты' в среде разработки, типа Cursor или Claude Code?

Я бы еще и Browser Extension подтащил для интеграции с чат-ботом, но это уже более сложная задача.

-1

PowerHTML

vagon333 Jul 3 at 15:49

Обязательный инструмент во все школы.

T-Shaped специалист: эволюция или ловушка современного IT?

vagon333 Jul 3 at 15:03

ИИ сильно снижает порог входа в соседние области, поэтому умение быстро переключаться между ними снова становится конкурентным преимуществом.

Именно это имел в виду.

Cейчас больше время опытных разработчиков и архитекторов.
Джунам, без глубокого понимания архитектуры и прикладных областей, особенно нужна помощь становиться на рельсы.
И менторинг должен сильно отличаться в сторону critical thinking и понимания общей картины архитектуры, и прикладной задачи.

T-Shaped специалист: эволюция или ловушка современного IT?

vagon333 Jul 3 at 14:04

В 90-х Full-Stack был скорее нормой.
В нулевых началось расслоение и достигло своего пика до момента появления AI.

Сейчас, я словно вернулся в девяностые и мне чертовски нравится это изменение.

2 3 ...

65 66