Комментарии / Профиль chisi / Хабр

Кисиев Александр@chisi

Пользователь

Подписчики

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

Да, вы правы. ast обычные #-комментарии не видит, через него я вытаскивал именно docstring’и и сигнатуры. # - комментарии отдельно собирались построчным сканером по регуляркам( конкретно по этой PY_COMMENT_RE = re.compile(r"^\s*#\s?(.*)$") ). Для прототипа этого хватило; если делать промышленнее, я бы смотрел в сторону tokenize или LibCST.

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

chisi 5 июн в 14:31

Да, такая проблема действительно есть, но в нормальном RAG как раз не предполагается, что мы скармливаем модели всю документацию целиком. В моём случае я не передаю в LLM всё содержимое доков, ранбукови кода. В начале сервис ищет релевантные чанки через BM25, после этого собирается ограниченный контекст из найденных фрагментов. Поэтому даже если сама база знаний большая, в контекст модели попадает только небольшая выборка наиболее релевантных чанков.
Но проблема может возникнуть в том, что количество релевантных чанков, которые могут дать дополнительную полезную информацию, может быть больше, чем мы можем себе позволить при выборе top_k чанков. В таком случае другой возможности, кроме как менять модель на более мощную, не вижу.

В рейтинге: Не участвует

Откуда: Москва, Москва и Московская обл., Россия

Дата рождения: 14 мая 2006

Зарегистрирован: 2 июня

Активность: 14 июля в 14:58

Бэкенд разработчик, ML разработчик

Стажёр

C++

Python

ООП

Git

SQL

PostgreSQL

Docker

Linux

Английский язык

Алгоритмы и структуры данных

Информация

Специализация