Комментарии 4
А что вы всё-таки тестировали? Точность поиска опорных документов в RAG, т.е. эмбеддинги, или точность обработки найденных опорных документов для выдачи ответа?
А промпт, который используется это коммерческая тайна?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Оценивание LLM в RAG на клиентских и синтетических датасетах: методология и результаты