Pull to refresh
4K+
0
Кисиев Александр@chisi

User

2
Rating
1
Subscribers
Send message

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

Level of difficultyMedium
Reading time6 min
Reach and readers7.7K

Недавно делал учебный проект про автоматизацию документирования инцидентов. Поначалу планы были грандиозными: инциденты, таймлайны, интеграции с мониторингами, чатами, постмортемы, подсказки дежурным инженерам.

Но довольно быстро стало понятно, что с временными и ресурсными ограничениями лучше не пытаться написать маленький PagerDuty. Поэтому я сузил задачу до более реалистичного ядра: локального RAG-сервиса, который ищет по документации, ранбукам и коду, а затем передаёт найденный контекст в LLM.

Так появился llmortem — FastAPI-сервис, который можно подключить к OpenWebUI как OpenAI-compatible backend.

В статье расскажу, как устроена архитектура, почему я начал с BM25, зачем индексировать docstring’и и какие ограничения у такого подхода.

Читать далее

Information

Rating
1,975-th
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity

Specialization

Бэкенд разработчик, ML разработчик
Стажёр
C++
Python
ООП
Git
SQL
PostgreSQL
Docker
Linux
Английский язык
Алгоритмы и структуры данных