В этой статье я покажу, как всего за 30 минут подключить автоматическое AI-ревью кода в вашем проекте — бесплатно, без токенов, без OpenAI и полностью локально.
В основе решения — три компонента: Ollama, AI Review и GitHub Actions. Ollama отвечает за запуск локальной LLM прямо внутри CI/CD без интернета и внешних API. AI Review — опенсорсный инструмент, который анализирует изменения в Pull Request и оставляет комментарии прямо в GitHub. GitHub Actions обеспечивает автоматический запуск ревью при каждом изменении кода.
Система работает полностью изолированно: код никогда не покидает репозиторий, данные не отправляются во внешние сервисы (OpenAI, Claude, Gemini), а результат формируется локальной моделью в виде inline-комментариев и summary-отчёта.
Иными словами, вы получаете тот же уровень «умного ревью», что и в облачных решениях, но без платы, VPN и рисков для безопасности. В качестве LLM мы будем использовать Ollama, а анализ кода выполнит AI Review, о котором я подробно рассказывал в предыдущей статье. Тот же подход можно адаптировать под GitLab, Bitbucket или Jenkins — всё кроссплатформенно и не привязано к конкретному CI.
Что такое Ollama и зачем она нужна?
Когда речь заходит об AI-ревью, первый вопрос — на какой LLM оно будет работать. Обычно разработчики вспоминают OpenAI, Claude или Gemini. Но у таких решений есть три очевидных минуса: они стоят денег, недоступны в ряде стран (РФ, РБ), и требуют отправки кода во внешние сервисы.
Теперь представьте, что ту же модель можно запустить прямо внутри CI/CD — без токенов, VPN и передачи данных наружу. Вот здесь и появляется Ollama. Это не альтернатива OpenAI, а удобный локальный адаптер, позволяющий разворачивать модели вроде llama3, phi3, mistral, codellama и других в один Docker-контейнер и обращаться к ним через HTTP API.
Для AI Review это идеальное решение: инструмент не зависит от конкретного провайдера, поддерживает любую модель — от «тяжёлых» GPT-уровня до лёгких локальных — и при необходимости легко переключается на свой LLM endpoint.
Хотите локально — ставьте Ollama, нужно в облаке — подключайте OpenAI, Claude или собственный inference-сервер. AI Review универсален по дизайну и одинаково хорошо работает в CI, на сервере или в корпоративной сети без выхода в интернет.
Настраиваем AI Review
Чтобы запустить ревью, достаточно минимального конфига. AI Review из коробки поддерживает GitHub и умеет анализировать Pull Request без дополнительной настройки. Всё сводится к нескольким строкам YAML — можно просто положить файл в корень проекта.
Создаём .ai-review.yaml:
# Используем локальную LLM через Ollama llm: provider: OLLAMA meta: model: mistral # модель, которую будет использовать ревью max_tokens: 2048 # ограничение на размер ответа temperature: 0.2 # чем ниже, тем строже ответы http_client: api_url: http://localhost:11434 # локальный endpoint Ollama timeout: 600 # запас по времени для генерации # Подключаемся к GitHub для по��учения PR и публикации комментариев vcs: provider: GITHUB http_client: api_url: https://api.github.com timeout: 120
И всё — AI Review подключится к локальной модели через Ollama и начнёт анализировать изменения в вашем PR.
Если хотите добавить собственные промпты, изменить стиль комментариев, ограничить количество замечаний или исключить файлы из анализа — всё это настраивается в расширенном конфиге. Подробности — в документации AI Review.
Настраиваем GitHub Actions
Теперь добавим пайплайн, который будет запускать ревью в CI/CD. Всё просто: создаём файл .github/workflows/ai-review.yml. Он поднимает Ollama, скачивает модель, прогревает её и запускает AI Review.
Для других CI (GitLab, Bitbucket, Jenkins) всё аналогично — нужно лишь поднять контейнер Ollama и вызвать CLI-команду ai-review run.
Создаём .github/workflows/ai-review.yml:
name: 🤖 AI Review on: # Ручной запуск пайплайна (можно заменить на on: pull_request) workflow_dispatch: inputs: review-command: type: choice default: "run" options: [ run, run-inline, run-context, run-summary ] description: "Какой тип ревью запустить" pull-request-number: type: string required: true description: "Номер Pull Request" jobs: ai-review: name: Run AI Review runs-on: ubuntu-latest # Поднимаем локальную LLM Ollama в фоне services: ollama: image: ollama/ollama:latest ports: [ 11434:11434 ] steps: # 1️⃣ Клонируем репозиторий - name: 🧱 Checkout repository uses: actions/checkout@v4 with: fetch-depth: 0 # нужно, чтобы видеть diff в PR # 2️⃣ Ждём, пока Ollama поднимется - name: ⏳ Wait for Ollama to start run: | echo "⏳ Ожидаем запуск Ollama..." for i in $(seq 1 30); do if curl -s http://localhost:11434/api/version; then echo "✅ Ollama готова!" break fi sleep 3 done # 3️⃣ Скачиваем выбранную модель (в примере — mistral) - name: 📦 Pull model run: | echo "📥 Загружаем модель 'mistral'..." curl -X POST http://localhost:11434/api/pull \ -H "Content-Type: application/json" \ -d '{"model": "mistral"}' # 4️⃣ Прогреваем модель (чтобы первый запрос не был долгим) - name: 🔥 Warm up model run: | echo "🔥 Прогреваем модель..." curl -s -X POST http://localhost:11434/api/chat \ -H "Content-Type: application/json" \ -d '{"model":"mistral","stream":false,"messages":[{"role":"user","content":"Hello!"}]}' echo "✅ Warm-up complete." # 5️⃣ Запускаем ревью - name: 🚀 Run AI Review # Укажите актуальную версию инструмента uses: Nikita-Filonov/ai-review@v0.27.0 env: # GitHub токен для доступа к PR VCS__HTTP_CLIENT__API_TOKEN: ${{ secrets.GITHUB_TOKEN }} # Контекст PR (репозиторий и номер) VCS__PIPELINE__OWNER: ${{ github.repository_owner }} VCS__PIPELINE__REPO: ${{ github.event.repository.name }} VCS__PIPELINE__PULL_NUMBER: ${{ inputs.pull-request-number }} with: # Тип запускаемого ревью: полный, только inline или summary review-command: ${{ inputs.review-command }}
Если вы используете GitLab CI, Jenkins или Bitbucket Pipelines — просто повторите те же шаги: запустите Ollama в контейнере, скачайте модель и вызовите CLI-команду
ai-review runс нужными переменными окружения.
Результат
После настройки всего пайплайна можно запустить ревью вручную — достаточно выбрать команду (run, run-inline, run-context, run-summary) и указать номер Pull Request. Это делается прямо из вкладки Actions → AI Review → Run workflow:

После старта GitHub Actions поднимает контейнер с Ollama, скачивает выбранную модель (в нашем примере — mistral), прогревает её и запускает AI Review. В логах можно видеть все шаги пайплайна — от инициализации контейнера до публикации комментариев:

Через пару минут в самом Pull Request появятся комментарии от GitHub Actions:
Inline-комментарии — конкретные замечания по строкам кода:

Summary-комментарий — общий обзор изменений и рекомендации:

Важно: чтобы бот мог публиковать комментарии, убедитесь, что
GITHUB_TOKENимеет праваread+writeдля Pull Request. Это можно включить в настройках репозитория или явно указать в workflow.
Есть нюанс
Нужно понимать: Ollama — это не облачный OpenAI, и на CI/CD с ограниченными ресурсами она может работать заметно медленнее. Скорость генерации напрямую зависит от самой модели, длины промптов и количества токенов в ответе.
В базовой конфигурации из статьи ревью может занимать от 1 до 3 минут на файл, и это нормально для локального запуска без GPU. Если хочется ближе к облачному опыту — просто перенесите Ollama на:
отдельный self-hosted runner с выделенными ресурсами;
или облачную виртуалку (4+ CPU, 8+ GB RAM — минимально комфортно);
или GPU-инстанс, если используете крупные модели вроде llama3 или codellama.
Важно понимать: AI Review не тормозит сам по себе — его скорость полностью зависит от LLM-провайдера, к которому вы подключены. Сегодня это Ollama, завтра может быть OpenAI, Claude, Gemini или даже ваш внутренний inference-сервер. Интерфейс и логика работы останутся теми же.
Главная идея — гибкость и автономность, а не “чудо за бесплатно”. Этот пример показывает, что можно построить AI Review, не отдавая код вовне и не платя за токены. А вот как быстро и на какой модели — зависит уже от выбранного стека и ваших ресурсов.
Заключение
В итоге мы получили полноценный AI code review, работающий прямо в CI/CD — без токенов, без внешних API и без копейки затрат. AI Review анализирует Pull Request, оставляет inline-комментарии, формирует summary — и всё это происходит внутри вашей инфраструктуры, без передачи кода наружу.
По сути, всё, что нужно — это Docker, GitHub Actions и минимальный конфиг. Дальше вы сами решаете, как масштабировать решение: оставить базовый сценарий на GitHub или развернуть Ollama на self-hosted runner или облачном сервере с подходящими ресурсами.
Важно понимать: в мире, где OpenAI, Claude или Gemini стоят денег, требуют VPN и не всегда доступны, локальные решения — это не компромисс, а альтернатива. Они дают ту же пользу — помогают команде писать чище, быстрее и увереннее — но делают это безопасно и доступно каждому.
При этом решение не требует токенов, VPN или внешних зависимостей — всё можно запустить локально, в изолированной среде. А если в будущем появится необходимость — вы всегда сможете подключить другую LLM, будь то OpenAI, Claude, Gemini или собственный корпоративный inference-сервер.
Полезные ссылки и демо
Чтобы не тратить время на поиски — вот всё, что нужно для повторения примера и вдохновения:
AI Review — опенсорсный инструмент для автоматического анализа кода и ревью изменений. Поддерживает GitHub, GitLab, Bitbucket и другие CI/CD-платформы, а также совместим с большинством популярных LLM-провайдеров — OpenAI, Claude, Gemini, Ollama.
Пример Pull Request с комментариями от AI Review (inline + summary)
Подробная документация по настройке промптов, фильтров и расширенной конфигурации
Если статья оказалась полезной — поставьте звёздочку репозиторию AI Review на GitHub. Это поможет проекту развиваться и оставаться полностью бесплатным и опенсорсным.
Если вам интересны практические инженерные решения на стыке CI/CD, тестирования и AI — я регулярно разбираю такие кейсы в своём Telegram-канале.
Там — реальные конфиги, пайплайны, инструменты и разборы без маркетинга и «AI ради AI».
