babikovвчера в 03:31

Я сделал локального AI-агента для России. Без VPN, без подписки, без облака

Простой

3 мин

29K

Искусственный интеллект

Кейс

+51

Комментарии 89

winkyBrain 23 часа назад

Коллеги из западных команд говорят, что скорость разработки выросла в два раза. Не в полтора — в два. Это не хайп, это реальные цифры от реальных людей.

в 100500 раз!! главное в конце добавить, что это "реальные цифры от реальных людей", для большей убедительности) все ваши заявления про "без впн, без облака" и прочее тоже пустые слова, без ссылки на репу

JohnWang 22 часа назад

Там очень сильно зависит от характера задач. Если ты условный сеньор пишущий уникальный не имеющий аналогов код с уникальным функционалом - наверное, не сильно скорость выросла.

Если ты условный миддл на типовых мелких задачках - то и в 3 раза могла вырасти.

Если ты как я не кодер, до лида вырос из QA и твой потолок - читать чужое то возможность спросить чатгпт или дикпика и не дёргать по каждой фигне того самого сеньора - вообще бесценна.

daktfi 8 часов назад

Даже банальный бесплатный чат - уже помогает, ибо получается офигенский справочник по всякому разному. Типа, "а как бы мне закатить Солнце вручную, да чтобы на свежеизобретённом велосипеде?" - а она в ответ, мол, есть либа такая и либа сякая, а в стандарте написано то и это. И уже на этой волне спокойно идёшь на тот же cppreference или истчо куды.

HMNIJP 5 часов назад

"а как бы мне закатить Солнце вручную, да чтобы на свежеизобретённом велосипеде?"

1. Определите тип привода

Как именно ваше изобретение взаимодействует с небесным светилом?

Гравитационный зацеп: Ваш велосипед настолько массивен, что создает собственное поле, «подцепляя» Солнце за край короны и утягивая его за горизонт при нажатии на педали.
Оптический редуктор: Велосипед оснащен системой линз, которые преломляют свет так, что для наблюдателя закат происходит ровно в такт вашему вращению педалей.
Метафизическая цепь: Вы набрасываете цепь прямо на солнечный диск (осторожно, используйте жаропрочную смазку!).

...

Rubilnik 20 часов назад

Типичный пример оборота из нейрослопового текста.

yarovikov 13 часов назад

Я вчера убил 2 часа рабочего времени, исправляя казалось бы простой пропущенный мню косяк (cloude opus 4.6). Чтобы не убить еще больше времени, пришлось прямыми запросами базы править.

daktfi 8 часов назад

Ну вот я вполне себе программист на плюсах со стажем, опытом и квалификацией. Поручить те же юнит-тесты нейронке (только сначала дать ей ТЗ, а потом по рукам и по жопе, когда косячит) - реально кратное ускорение работы. 5 минут на ТЗ, 10 минут она там что-то колбасит, ещё 5 минут проверить за ней и ещё 5 минут на исправления. Самому тот же тест писать - час, и ещё не факт, при копипасте не зевнёшь какую-нибудь ерунду. "Возьми вот этот метод и сделай такой же, только с перламутровыми пуговицами" - та же история (ну, смотря какой метод, конечно). Какие-нибудь радикальные потрахушки с тем же грпц "а вот перепиши мне эти методы с CQ на колбэки... не, кака вышла, верни взад, только вот и там поменяй Х на У", при том что сам я с этого грпц пухну и зверею - уже одно это дорогого стоит.

Словом, про два раза не знаю, очень сильно зависит от текущих задач и от кода, но туеву хучу нудной рутины на неё спихнуть - как два байта переслать за одну посылку. И при этом пока она ломает один кусок кода - я спокойно роюсь в другом одновременно.

Robastik 23 часа назад

В чем смысл велосипедить, если есть опенсорсные Qwen Code CLI, Gemini CLI, в комплекте с неплохо реализованными скиллами, субагентами, работой с контекстом, всеми другими необходимыми фичами, есть куча вариантов браузерных и всех других mcp, и все это просто повторить в одно лицо невозможно, не говоря уже о том, чтобы сделать лучше? Просто переделать под локальный инференс - и все.

Vitaly1387 22 часа назад

Автор молодец. В чем тут велосипед. Так в расоряжении имею своего агента. Уже год как пользуюсь. Когда столкнешься с тем что qwen code или opencode перестает адекватно работать тогда и начинаешь писать свой агент лишенных этих изьянов. По итогу пользуюсь платным claude code и своим. Автор молодец.

Robastik 3 часа назад

qwen code или opencode перестает адекватно работать тогда и

Вернись на работающую версию.

Или возьми от них то, что работает, и добавь свое.

В чем смысл с нуля огород городить?

rsashka 22 часа назад

А где код приложения? Или вы предлагаете просто поверить вам на слово, что там нет мийнеров, бекдоров и прочих неприятных неожиданностей?

Vadiara50 19 часов назад

Вирустотал говорит, что всё нормально...

13i 19 часов назад

это не показатель. можно и в обновлении докинуть позже. Нужен код.

babikov 19 часов назад

Не уж то разработчику нельзя просто выпустить что-то )

Per_Ardua 18 часов назад

Конечно можно!

Для этого даже специальная платформа есть: github.

Не благодарите.

Yokushiro 17 часов назад

Можно следить за развитием проекта на гитхабе автора: https://github.com/babikov/doka-site/releases

Per_Ardua 10 часов назад

Вы шутите?

Там нет кода, только стопка exe файлов.

Думаю у нас разное понимание о том, что такое "следить за развитием проекта".

ImUgh 17 часов назад

А вы точно разработчик, если спрашиваете такое?

rsashka 19 часов назад

Он сканирует уже известные сигнатуры и было бы предупреждение, если бы бинарь уже был заражен каким нибудь известным вирусом или трояном. Как Вирус-тотал может узнать о каком-то новом приложении, например, с бекдором?

Vadiara50 19 часов назад

Имхо, выкладывать на хабр свою поделку с бекдором-чистое самоубийство для разраба... Не думаю, что автор настолько коварен)

rsashka 19 часов назад

А в чем проблема? Это бизнес и если он приносит доход, то можно хоть каждый день регистрировать нового пользователя и писать для него статью и даже создавать публичные репозитории, якобы для аудита, а потом при распространении собирать бинарь с “дополнительными опциями”.

413x 16 часов назад

Современные антивирусы показывают что угодно, но маркеры не вирусы

Grigo52 14 часов назад

Не переживайте, локальная нейросеть сама по себе сожрет все ресурсы вашей видеокарты так, что на майнинг просто ничего не останется

rsashka 12 часов назад

Сперва ресурсы видеокарты, потом что? пароли от кошельков или узел для сети ботов?

Agivanch 22 часа назад

Поторопился с первым комментарием. Скачал приложение, посмотрел. Что могу сказать - мягко говоря - сыроватое и не хватает меню настроек к этому всему. Чего не хватает, конкретно мне, как потребителю для первого MVP:

Не вижу потребление ресурсов;
Не могу сменить модель через интерфейс;
Не могу выкачать диалоги в json;
Не понимаю, чем принципиально отличается от LMstudio с добавлением RAG интерфейсов с MCP серверами?

babikov 22 часа назад

Спасибо за отличный фидбэк!
Модели пока только переключение между версиями Qwen3 (в правом верхнем углу), вы правы надо добавить кастомизацию моделей.
Все json чатов хранятся в пользовательской папке doka.
Добавлю в следующей версии.

Stitch505 16 часов назад

А насколько длинный диалог ии может помнить?
Это я к тому, что chat gpt начинает деградировать достаточно быстро от тяжелых запросов, а как обстоят дела с вашим товарищем?

babikov 16 часов назад

Дока работает полностью локально — вся история держится в памяти компьютера. При ~16 GB RAM это ~8–16 тысяч токенов (≈ 6–12 тысяч слов). Когда место заканчивается, приложение честно скажет об этом.

shirmanov 21 час назад

А чем ollama принципиально отличается от lmstudio? Т.е. ollama не нужно было делать?

Agivanch 21 час назад

Плохого ни чего нет, в создании своего продукта и наращивании функционала. Не об этом вопрос, не агрись.

Grigo52 14 часов назад

Ничем не отличается. Это просто урезанная версия существующих опенсорсных комбайнов, где за пользователя жестко захардкодили выбор одной модели, чтобы он не запутался в настройках

deadmoroz14 22 часа назад

Хорошая работа.

Подскажите, когда будет релиз второй версии?

babikov 22 часа назад

Дока 2 пока впереди )! А небольшие обновления будут в течении недели.

Kenya-West 20 часов назад

Дока 2

Без вытаскивания кишков десять минут релиз не будет засчитан! /s

babikov 20 часов назад

Выпущу спец версию ты либо убиваешь зомби, либо ты и есть зомби! И там можно выворачивать кишки по 10 минут!

Daniil_Gusev 22 часа назад

Модель скачивается автоматически при первом запуске, приложение само выбирает подходящую под ваше железо.

Мягко говоря, странное решение, если вы на технически подкованную аудиторию нацелились.

babikov 22 часа назад

Учту в следующей версии!

MAT-POC 21 час назад

Для технически подкованной есть LM Studio. Эта аскетичная версия как раз для гуманитариев и чайников, где за тебя подумал специалист.

antytoto 22 часа назад

Вы молодец, что сделали свой проект, уверен, он многим поможет. Раньше мы с командой уточняли: «дока» — это про документацию, или про «Доку» как проект онлайн-энциклопедии — теперь будем разбавлять вариантом про AI

shirmanov 22 часа назад

Отличная работа! Никого не слушайте, продолжайте пилить!

Toolza 21 час назад

Круто получилось, но странно почему разработчик не сделал версию для линукс, только для операционок которыми пользуются обычные юзеры.

rsashka 21 час назад

только для операционок которыми пользуются обычные юзеры.

Потому что обычные пользователи меньше задаются вопросом, что в реальности делает скачанное приложение с полным доступом к компьютеру пользователя и интернету.

kvruser 18 часов назад

вы про браузеры?

rsashka 18 часов назад

В том числе :-)

diakin 16 часов назад

"Если у вас паранойя, это не значит что за вами не следят!" (с)

Grigo52 14 часов назад

Обычные юзеры на винде эт как раз те люди, которые скачают exe файл по ссылке с хабра, отключат дефендер и радостно установят себе троян

MAT-POC 21 час назад

Отличная, работа! Всё сделано руками и очень круто! Ничего лишнего. Я не знаю на сколько тяжело поменять LLM сеть, но если будет возможность добавьте туда qwen 3.5 9b и Гигачат 3,1 Лайт они по качеству примерно одинаковые на карте с 8 Гб в LM Студии работают нормально. Гигачат 3,1 - заметно быстрее Qwen 3.5.

https://habr.com/ru/companies/sberbank/articles/1014146/ - вот обсуждение Гигачата.

Можно добавить к списку загружаемых файлов MD ?

babikov 21 час назад

Хорошо сделаю!

Dron76 21 час назад

В чем отличие от perplexica ( не путать с perplexity) и open webui подключенных к бекенду в виде тех же lmstudio и ollama?

babikov 21 час назад

Ну это больше для пользователей, которые не смогут такое сделать.

willDJ 16 часов назад

Пишет пользователь чайник. На моем ноутбуке не увидел установленного хрома написал, что нужно установить. не удалось вобщем попробовать

babikov 16 часов назад

Буду решать в ближайшей версии

MAT-POC 12 часов назад

у меня хрома нет, есть яндекс браузер - работает нормально

MAT-POC 21 час назад

1. иногда он долго ищет, пользователь передумал - желательно прерывать это занятие по клавише Esc

Он пишет что не может открыть браузер. EУ вас вроде написано что "открывает браузер заполняет формы" ...

Как Вы считаете локальные модели уровня Qwen 3.5 9b / GigaChat-3.1 Lite 10B могут нормально работать с аналогами openclaw ?

babikov 20 часов назад

Ок, учту этот момент.
Браузер открывается в headless варианте, скорее всего на компьтере не стоит хром. В дальнейшем плаировал использовать другой браузерный движок.
Насчет этих моделей не могу сказать точно так как не тестировал.

MAT-POC 12 часов назад

хрома у меня нет, есть Яндекс браузер

VO_Obsidian 21 час назад

Хотелось бы сравнение с той же LM Studio. Чем это решение отличается? Чем лучше?

Hadjimurad 20 часов назад

На linux?

ImUgh 20 часов назад

Если это для домохозяек и/или тех, кому лень разбираться, то что по минимальным требованиям к железу?

babikov 19 часов назад

Для них в том числе )

ImUgh 19 часов назад

Так а с железомом-то что?

AndyRom0 20 часов назад

На вин7 не запустилось, пишет - не является приложением win32, хотя система 64бит. При первоначальном запуске и попытке отладки - необработанное исключение win32 в [9200...

babikov 19 часов назад

Ок буду разбираться почему такое вылезло, пока такого не было.

AndyRom0 15 часов назад

Спасибо, буду ждать положительного результата! Кстати, попытка установить LM Studio на эту же систему (win7) закончилась так же, - необработанное исключение [...]

Kovurr 19 часов назад

Win7 вышла 17 лет назад, на ней современный софт чаще не работает, чем наоборот. Выбросьте ее и ставьте 10-ку.

Alex-ok 19 часов назад

Все что у вас перечислено в разделе ‘Что я делаю с Докой каждый день’ можно сделать в том же бесплатном и доступном без впн дипсике, и без всяких плясок с бубном. Другое дело локальная работа с файлами и фоновые задачи. Так что ждем, держите в курсе!

lgorSL 19 часов назад

Из моделей ещё интересная GLM-flash - она чуть побольше, но с экспертами, и из-за этого работает сильно шустрее. На видеокарте 4080 я видел скорость генерации больше ста токенов в секунду.

ris58h 18 часов назад

про то чего не хватает

На лэндинге ничего не увидел про системные требования. Простыми словами: сколько оперативки надо и сколько диска?

Croakerx64 18 часов назад

А на гитхаб есть планы выложить в виде опенсорса?
Это было бы очень полезно даже в плане изучения

domix32 18 часов назад

Изоляция в докер контейнер с обычной вебмордой будет?

babikov 18 часов назад

Пока не планировал такого

Gamefin 18 часов назад

@babikovа твоя llm может проводить тестирование сайтов? Писать кейсы проверок? Анализировать функционал?

babikov 17 часов назад

сейчас пока нет но этот функционал есть в моем локальном агенте, в доку я еще это не переносил

GraphDark 18 часов назад

Я простой Иван, город Сарапул...

valera_efremov 17 часов назад

Присоединяюсь к вопросам выше - какое потребление ОЗУ и какая минимальная видеокарта? Обязательно иметь rtx 5090?

Для "вайбкодинга" подходит?

413x 16 часов назад

Проект полезный, пригодится, есть схожий проект Jan, тоже в эту сторону смотрит. LM-Studio визуально перегружен. Если получится добавляться последние фишки, сделать каталог нейросетей последних, мониторить их улучшения (поднимать в рейтинге те что выше процент, качественнее, сделать категории - кодинг, общее, распознавание фото?...). У Jan вечно какие-то протухшие модели в каталог. Опять же были какие-то хитрости, чтобы запускать модели на видеокарте, расширять память и прочее, можно тож внедрить включение условно галочкой в настройках.
Еще интереснее было бы двигаться в сторону опенсорса (тупо больше интереса будет к проекту и популярности) и сделать систему пожертвований, чтобы подогревало дополнительный интерес.
Успехов с проектом.

babikov 15 часов назад

Спасибо очень приятно такое слышать, насчет каталога нейронок отличная идея, а вот Jan не видел надо будет глянуть.

normal 11 часов назад

да вроде Jan тоже бодро обновляется -- так и из HF там можно сразу модели тянуть (внутри самого Jan) - и еще у них фишка - своя легкая моделька для тулинга под десктоп задачи - которая может вызывать "тяжелые" llm (хоть локальные, хоть по апи внешние). такого пока ни у кого нет.

Ndochp 15 часов назад

Пропустил возможно, с радеонами работает?

Grigo52 14 часов назад

Такой программист момент

Вместо того чтобы взять готовый lm studio или gpt4all, человек тратит выходные на написание своего велосипеда с урезанным функционалом, а потом пытается выдать это за продукт для массового юзера

Partizan_v_kedah 13 часов назад

Скачал, но так запустить и не удалось. Пытаюсь задать простой вопрос, пишет "попробуй позже" и потом уходит в постоянную загрузку "подготавливают окружение".

На втором ноуте почему то вообще не запустилось, там ошибка уже на стороне windows. Хотя на обоих ПК win10 стоит, с одной и той же флешки

Ufo28 13 часов назад

А можно клиент-серверный вариант?
На одном компе с видеокартой (желательно чтоб linux поддерживался) запускается модель, а потом на всяких лёгких ноутбуках можно подключать клиент, который будет её использовать?

Bluewolf 12 часов назад

Можно, вам потребуются бесплатные и популярные ollama или llama.cpp и opencode. Настройка и так проста, но может быть выполнена любым уже работающим агентом.

SlavaVSLK 12 часов назад

Я может чего-то не понимаю, а в чем отличие от того же lm studio, в который можно добавлять тулзы и мцп при необходимости? Хочешь кодинг агента, включил lm server подкинул в ide через расширение и гоняй его там сколько влезет. В чем фишка, объясните пожалуйста?

Bluewolf 12 часов назад

Фишки нет, подобное пишется claude целиком вместе с сайтом за час, а сайт с каким-никаким трафиком и аккаунт хабра - не лишние) Да и без них - прикольно же

Правка 8, правка 10...

StjarnornasFred 11 часов назад

Полезная идея и похвальное начинание! Поставил на рабочий моноблок (i5-1135G7, 16/1024, встройка). И сразу "но"...

1) Непонятно, какой "движок" скачивается и работает. По разговору с Докой я понял, что это какой-то обрезок Qwen, который свою версию назвать не смог. Стоит добавить как минимум самоинформацию, а лучше - выбор.

2) работает оооочень медленно. Долго думает, прежде чем ответить на простейший запрос типа "открой сайт ya.ru"

3) вообще не умеет взаимодействовать с установленными программами. Попросил запустить блокнот - Дока, долго подумав, отказалась, сославшись, что не умеет.

4) глуповат в текстовом чате. Отвечает лаконично и с массой ошибок в русском языке.

Надеюсь, что это всё детские болезни - первая версия, многого не ждёшь. Верю в светлое будущее и обновления!

durnoy 10 часов назад

Вы в начале статьи привели в пример

Cursor, Claude Code, Copilot

которые на разработку ориентированы, а потом раз -- и сделали ассистента, который ходит по интернету.

я видел в конце статьи про планы сделать работу с локальными файлами, но все равно это немного другая цель по сравнению с, скажем, Claude.

brat_viktor 5 часов назад

Я работаю под Ubuntu. Что мне делать?

IgVlB 1 час назад

На взгляд "массового user-а" такой инструмент в современных условиях очень нужен и будет востребован.

Часто приходится быть именно массовым user-ом, которому для решения текущей задачи быстро нужен простой инструмент, и на всё остальное (типа бесконечных смен VPN, затей с lm studio, и др.) времени просто нет, и точно не будет. Приоритеты не те.

Doka на Win-11 (4070Ti-Super) установился без проблем. Отвечает с задержкой, но терпимо.

На мой взгляд не хватает режима "perplexity", когда нужны ссылки на источники, послужившие информацией для ответа.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий