bartov-e24 апр 2025 в 22:39

Часть 3. Обзор технологий RAG для LLM: оптимизация извлеченных данных

Простой

5 мин

4.1K

Natural Language Processing * Искусственный интеллектИзучение языков

Обзор

Перевод

Комментарии 3

vagon333 26 апр 2025 в 11:57

Крайне познавательно. Благодарю за перевод.

В системах RAG избыточная информация может негативно влиять на итоговую генерацию LLM (Large Language Model), а слишком длинные контексты вызывают проблему «потери в середине» (см. рис. 1).

График приведен на основании OpenAI GPT 3.5 Turbo моделей (старые).
Для обновленных моделей предполагаю, что не все так плохо, учитывая стандартный тест "Needle In a Haystack".

Не умоляю необходимость корректировки извлеченного контекста, но обращаю внимание, что проблемы меняются так быстро, что некоторые становятся менее актуальными.

itit20 26 апр 2025 в 15:18

bartov-e 26 апр 2025 в 15:23

Благодарю за комментарий. У меня не было возможности сравнить то, как было раньше с тем, как есть сейчас, но могу уверенно сказать, что то, как есть сейчас, меня категорически не устраивает — модели постоянно зажевывают середину. Собственно, это и стало одной из причин, по которой я стал интересоваться вопросами RAG - без RAG возможности ИИ-перевода в профессиональных целях выглядят совсем грустно.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий