Комментарии / Профиль Kapral07 / Хабр

ML Engineer

Анатомия AI-агента: что внутри этой штуки, которую все хотят, но никто не понимает

Спасибо за статью! Как Вы считаете, RAG в агенте лучше применять как tool для получения ответа на вопрос, либо для получения релевантных чанков (без этапа генерации)? Кажется, что релевантные чанки могут быть полезнее, чем сам ответ, но излишняя информация может агента сбить с пути

Retrieval-Augmented Generation (RAG): глубокий технический обзор

Kapral07 4 авг 2025 в 05:14

Если позволяют ресурсы - https://huggingface.co/BAAI/bge-reranker-v2-m3 отличная модель реранкера (с динамической квантизацией тоже показывает очень хорошие результаты), с ней метрики значительно подрастут. А перед реранкером по-хорошему поиск комбинацией BM25 и Embeddings

RAG: борьба с низким качеством ответов в условиях экономии памяти на GPU

Kapral07 11 апр 2025 в 17:54

Отдельная боль таких документов - таблицы, которые могут иметь разные структуры и размеры