Комментарии 5
"А знаешь ли ты всю правду, %USERNAME%?..."
Интересная гносеологическая задача :)
Hidden text

1) никакой RAG не поможет если чанкинг разбил на части то что нельзя разбивать на части
2) техника доп проверки моделью релевантность каждого фрагмента документа до непосредственной передачи в модель для генерации ответа работает оч эффективно. и как правило для этого можно использовать менее умную/дорогую модель
но про self-rag так и не понял как это точно работает
Это интересно, спасибо за статью. Я интуитивно подозревал что модель не может сама себя проверять, так как находится на том же уровне. И да, более развитой моделью имеет больше смысла проверять, и если ответ модели не текст, а json, код, sql, то можно ранить/проверять валидность, и при не удачи просить переделать.
Можно ли научить чат-бота всегда говорить правду