Иногда нужна языковая модель, которая работает без интернета — на борту самолёта, в закрытом корпоративном контуре и т.д. В других случаях интернет есть, но платить за подписку не хочется. В этой статье — пошаговый разбор двух сценариев: локальный запуск через LM Studio и четыре бесплатных облачных агента, которые работают прямо в IDE.

Статья также доступна в формате видео.

Выбор модели

Для примера буду использовать Qwen3.5 — open source модель от Alibaba. Принципиальной привязки к ней нет: всё, что я покажу дальше, работает с любой другой моделью. Просто сейчас это один из лучших вариантов по соотношению качества и требований к железу.

Модели обычно выпускают серией с разным количеством параметров. Чем больше параметров — тем мощнее железо нужно и тем лучше качество ответов. Последнее время появляются модели, которые вообще можно запустить и на телефоне, но понятно, что и соображают они соответственно. У меня MacBook на M3, на нём со скрипом запускается модель на 35B, а нормально — вариант на 9B параметров.

Чтобы подобрать модель под своё железо, можно воспользоваться сайтом canirun.ai — там можно посмотреть, что вообще существует и что пойдёт на вашем железе.

Перед локальным запуском модель можно проверить в браузере на странице модели на Hugging Face — там же есть inference и бенчмарки. Посмотреть, насколько хорошо она генерирует код (или не код) под ваши задачи.

Локальный запуск: LM Studio

Инструментов для локального запуска моделей много — Ollama, Jan, GPT4All и другие. Я буду использовать LM Studio: удобный интерфейс, встроенный чат для быстрой проверки модели и простой запуск локального сервера. Установка стандартная.

В поиске внутри LM Studio пишем название модели — qwen3.5. Появятся несколько вариантов разного размера. Выбираем под своё железо.

После загрузки запускаем встроенный сервер. Модель поднимается локально по адресу localhost:1234 и отдаёт API, совместимый с OpenAI. Убедиться, что сервер работает, можно запросом в Postman или Connekt (про это у меня есть отдельный гайд):

Подключаем к IDE через Kilo Code

Kilo Code — open source плагин для ИИ-кодинга, работает в VS Code и во всех JetBrains-based IDE. Буду показывать на OpenIDE — бесплатной российской IDE на базе IntelliJ Platform, поддерживает Java, Python, Go, TypeScript. Если у вас GoLand, PyCharm, IntelliJ IDEA или любая другая JetBrains IDE — всё аналогично.

Устанавливаем плагин Kilo Code из маркетплейса. После установки оставляем дефолтный профиль без изменений и создаём новый — выбираем провайдер LM Studio, указываем адрес localhost:1234 и модель.

Возвращаемся в чат и переключаемся на только что созданный профиль. Теперь агент видит файлы проекта, может редактировать код и запускать команды — и всё это локально, без интернета.

Работает полностью офлайн, без подписки, без лимитов на запросы. Для самолёта или закрытого контура — более менее рабочее решение. Для повседневного использования — честно, очень слабое: скорость генерации зависит от железа, качество уступает передовым моделям. Но маленькие модели становятся лучше с каждым днём. Думаю, как раньше невозможно было представить, что компьютер размером с комнату будет помещаться в кармане джинс, так и сейчас невозможно представить, что ультра маленькая моделька будет настолько же хороша, насколько и облачная (ну или по крайней мере более чем достаточна для повседневных задач).

Бесплатные облачные варианты

Расскажу про четыре. Все бесплатные, все в той или иной степени доступны в РФ и СНГ.

Kilo Code (облачные модели)

Тот же плагин Kilo Code. Помимо подключения своих моделей, он предоставляет бесплатные облачные модели — в том числе новые от крупных провайдеров, которые появляются здесь бесплатно сразу после релиза на какое-то время. Через Kilo Code можно также подключить любого облачного провайдера — OpenRouter, Anthropic, OpenAI — по ценам провайдера без наценки, со своим API-ключом.

Отдельный момент про Anthropic: если у вас есть подписка Claude, Anthropic довольно жёстко относится к её использованию в сторонних инструментах вроде Kilo Code. Можно использовать API-ключ, но передавать данные подписки плагину не стоит — могут заблокировать.

Qwen Code

СLI-агент от Alibaba, аналог Claude Code. 1 000 бесплатных запросов в день без лимита на токены. Устанавливается одной командой.

После авторизации через браузер можно запустить в терминале IDE. Можно также добавить его в Kilo Code как отдельный профиль — указать директорию с данными аутентификации Qwen Code в настройках провайдера. Тогда все агенты оказываются в одном интерфейсе.

OpenCode

Open source агент, 120k+ звёзд на GitHub. Поддерживает большое количество провайдеров, включая локальные модели. Периодически появляются бесплатные модели — MiniMax, MiMo, Nemotron. Подключить к Kilo Code не получится — запускается только в терминале.

OpenAI Codex

На момент написания статьи — временно бесплатен для всех пользователей, в том числе без подписки на ChatGPT, с ограниченным количеством запросов. Есть полноценное приложение для macOS и Windows с поддержкой нескольких параллельных агентов и git worktrees. Для регистрации нужен не-российский IP.

Как и Qwen Code, Codex можно добавить в Kilo Code как отдельный профиль. Такой подход мне нравится тем, что если закончатся запросы у одного агента — можно без проблем переключиться на другой, не выходя из IDE.

Расширенные настройки, MCP-серверы и Skills

В настройках Kilo Code есть раздел Agent Behavior — там можно развлекаться с MCP-серверами, правилами и скиллами. Любой подходящий MCP улучшает результат и экономит токены: вместо того чтобы грепать все файлы, агент сразу запрашивает нужный контекст.

Если пишете на Java или Kotlin со Spring — есть Spring MCP от Amplicode. Агент через него может сразу обращаться к контроллерам, эндпоинтам, репозиториям, не сканируя весь проект вручную. Сейчас в бета-тестировании, доступ по запросу черещ (info@amplicode.ru).

Заключение

Часть из того, что я показал, может очень быстро устареть — бесплатные тарифы закрываются, появляются новые инструменты. Если знаете агентов или связки, про которые я не рассказал, — пишите в комментариях.

Уже сейчас OpenIDE позволяет разрабатывать проекты на Java, Spring, Python, Go, JavaScript и TypeScript! А поддержка Docker и 300+ плагинов доступны абсолютно бесплатно в маркетплейсе. Пробуйте российскую IDE в деле и подписывайтесь на нас в Telegram или Max, чтобы не пропустить свежие обновления и полезные материалы.