CodeFoxAI4 мар в 06:16

Как мы сделали AI code review через Ollama без облака?

Простой

3 мин

10K

Искусственный интеллектМашинное обучение * DevOps * Open source * Python *

Из песочницы

+12

Комментарии 21

Закреплённые комментарии

CodeFoxAI 4 мар в 19:57

UPDATE (Alpha 0.3.5): Упростили синтаксис!

В версии Alpha 0.3.5 мы отказались от обязательного использования флага --command. Теперь работа с CLI стала интуитивнее и быстрее.

❌ Было: codefox --command scan

✅ Стало: codefox scan (и codefox init соответственно).

Чтобы обновиться до актуальной версии, выполните:
pip install --upgrade codefox

или

uv tool upgrade codefox

classx 4 мар в 06:53

https://ollama.com/tavernari/git-commit-message

> git diff | ollama run "tavernari/git-commit-message"

Denwer_py 4 мар в 16:48

Не смог запустить локально, простите) команда init просит токен ollama, что уже странно для локального запуска, потом scan выдает Failed to connect to mode: model 'gemma3:12b' not found (status code: 404) даже если конфиг из статьи подсунуть. Не интуитивно в общем :)

CodeFoxAI 4 мар в 17:23

Добрый день! Спасибо за честный фидбек, вы абсолютно правы - сейчас этот шаг выглядит неинтуитивно, простите за путаницу! 🙏

Позвольте пояснить, как это исправить прямо сейчас:

Запрос токена: Команда init просит токен, так как мы заложили поддержку облака Ollama Cloud. Но для работы строго локально этот шаг нужно просто пропустить (ввести null ). Вы правы, для локального инструмента это сбивает с толку. В следующем минорном патче я сделаю локальный режим дефолтным, чтобы токен запрашивался только при явном выборе облака.
Ошибка 404 (model not found): Эта ошибка от самой Ollama означает, что на вашем жестком диске еще нет весов этой модели. CodeFox пока не умеет скачивать их автоматически. Чтобы всё заработало, нужно предварительно выполнить в терминале: ollama pull gemma3:12b (или имя той модели, которую вы выбрали).

Посмотреть скачанные у вас модели можно командой codefox --command list (или на локальной машине через команду ollama list).

В следующий версии обязательно добавим авто-скачивание моделей и уберу обязательный вопрос про токен в новой Alpha-версии. Будем рады, если дадите инструменту второй шанс!

Denwer_py 5 мар в 04:30

Да, заработало, спасибо! Пробую на codellama

Denwer_py 5 мар в 04:32

Звезду на гитхабе влепил, мне нравится, будут обкатывать!

CodeFoxAI 4 мар в 19:57

UPDATE (Alpha 0.3.5): Упростили синтаксис!

❌ Было: codefox --command scan

✅ Стало: codefox scan (и codefox init соответственно).

Чтобы обновиться до актуальной версии, выполните:
pip install --upgrade codefox

или

uv tool upgrade codefox

Sol0Zon3 4 мар в 20:15

Вот бы еще этот инструмент умел запускаться в пайлайне CI/CD Gitlab и писать inline комментарии прямо в Merge Request. Планируется такая функциональность?

CodeFoxAI 4 мар в 20:22

Добрый день! Да, 100% планируется! :-)
Для пайплайнов мы готовим отдельную утилиту - это будут полноценные боты для GitLab CI и GitHub Actions, которые смогут делать ревью и писать inline-комментарии прямо в Merge Request

GarIlia 4 мар в 20:57

В качестве пожелания - было бы круто предусмотреть возможность подключения дополнительных MCP серверов. Например для периодической векторизации кода и метаданных проекта, для подключения собственных правил стат. анализа, интеграции с внешними источниками знаний (документация, ADR, архитектурные решения).
Тогда ревью в MR сможет опираться не только на diff текущего изменения, но и на накопленный контекст по репозиторию. Может сильно повысить качество cr

CodeFoxAI 4 мар в 22:46

Спасибо большое за развернутое пожелание! Да, мы как раз смотрим в эту сторону. Интеграция с MCP-серверами идеально ложится в нашу концепцию умного ревью. Одно дело - просто читать соседние файлы через RAG, и совсем другое - дать модели доступ к ADR и документации проекта при ревью Merge Request'ов. Это у нас уже есть в планах на следующие мажорные версии)

freelook27 4 мар в 22:20

уже есть давно такие инструменты

CodeFoxAI 4 мар в 22:59

Всё так, инструментов действительно много.
Но большинство из них - либо платные SaaS-решения, либо довольно простые скрипты, которые требуют отправки кода во внешний API.

Наша цель - сделать open-source инструмент, который:

может работать внутри изолированного контура (On-Premise);
поддерживает локальные модели вроде Ollama;
и понимает контекст проекта через RAG.

Кстати, а какие из существующих ботов вы пробовали на практике?
Буду признателен, если поделитесь, что в них понравилось, а что раздражало - это сильно поможет нам не наступить на чужие грабли 🙂

aladkoi 4 мар в 22:06

Даже не пробуйте. Для нормального анализа больших данных из rag нужна хорошая llm с нормальной контекстной длиной, а это только "поиграться" типа : " сколько у птички ножек ? "

CodeFoxAI 4 мар в 22:51

Справедливое замечание - если пытаться запихнуть весь проект в 7B модель.
Но архитектура CodeFox работает иначе.

Во-первых, мы не привязаны к одной LLM. В конфиге можно переключиться на Gemini или любой API через OpenRouter (GPT-4, Claude и т.д.), где с длиной контекста проблем нет.

Во-вторых, RAG не предназначен для загрузки “больших данных” в контекст. Его задача - точно извлечь релевантные куски.

В нашем случае это обычно 2–3 файла, связанные с Merge Request.

Для пре-коммит ревью этого более чем достаточно, чтобы ловить реальные баги, а не считать ножки у птичек 🙂

DezmontDeXa 5 мар в 04:39

Круто!

Я сам для компании писал аналогичный софт, но мне и компании не нравятся локальные llm и то что выдает гитхаб. Сделал на основе copilot cli (позднее перешёл на sdk).

У меня идёт бесконечный опрос целевых репозиториев, когда появляется запрос ревью у аккаунта бота - скачиваю дифф.

У нас они как правило большие, так что сразу разбиваю на чанки по ханкам.

Далее запускаю агента(cli/sdk) на репозитории и скармливаю чанки по очереди.

Результат работы агент сразу пишет в файл json.

Была трабла с номерами строк, агент часто их путает или пытается комментить старые строки. Оказало проще заставить агента писать абсолютный номер строки в его дифе, а уже затем конвертировать в line+side и фильтровать.

Результат по апи в виде комментариев к конкретным строкам кода, часто с susgestions.

Хочу попробовать вначале каждой строки прописать уникальный хэш, читал что одному парню удалось так улучшить навигацию агента по строкам.

Минусы подхода:

Работа через облако, хотя никто не мешает подключить локальную ллм к агенту
Требует подписки копилота для аккаунта бота

Плюсы:

Возможность юзать крутые модели (у нас используется sonnet 4.6)
Переваривает все диффы, за счёт чанкованмя
Работает автоматически, т.к. крутится на билд машине.
Расширяется с mcp
Это полноценный агент способный к параллельному изучению кода, а не только раг.

P.S. будете применять мой опыт - упомяните где-нибудь в репе)

t.me/dezmontdexa

shirmanov 5 мар в 07:22

Почему вы выбрали путь написать cli tool, а не skill или plugin для существующих агентов?

CodeFoxAI 5 мар в 07:36

Здравствуйте! Мы выбрали формат CLI по одной главной причине - независимость от среды разработки.

Часто разработчики используют тяжелые IDE (например, продукты JetBrains) параллельно с другими редакторами ради AI-плагинов. Это создает постоянное неудобство из-за переключения окон и контекста.

Наш CLI решает эту проблему: вы просто пишете одну команду в привычном терминале прямо перед коммитом и получаете быстрый аудит диффа, независимо от того, в чем вы писали код

DezmontDeXa 5 мар в 07:47

Топик стартер использовал голую ollama+rag, скорее всего с целью поддержки автоматизации и простоты развертывания.

А я как раз и использовал агент и уже к нему подключал qdrant mcp для более шустого поиска по коду. Github copilot cli/sdk - это полноценные агенты, просто с удобной возможностью автоматизации.

А вы бы как сделали?

4erva4ek 5 мар в 09:45

Привет. А можно доработать git diff чтобы он получал sourceBranch и targetBranch в качестве аргументов? А то проверять только свои незакомиченные измнения - это не совсем то код-ревью которым я занимаюсь регулярно.

CodeFoxAI 5 мар в 09:47

Привет! Да, 100% согласны. Текущий вариант хорош для "самопроверки" (pre-commit), но для роли ревьюера нужно сравнивать ветки целиком.

Добавить чтение диффа между ветками технически несложно, это логичный следующий шаг для нашего CLI. Учтем этот момент и добавим соответствующие аргументы в следующей версии. Спасибо за идею!

Sol0Zon3 5 мар в 15:52

Думаю будет справедливо упомянуть аналогичный инструмент, о котором тут тоже есть статья:

https://habr.com/ru/articles/951434/

Интересно, чей подход в итоге окажется более жизнеспособным

Зарегистрируйтесь на Хабре, чтобы оставить комментарий