IgorSh6311 янв в 07:14

Data-Feeling-School-RAG-Challenge или по ту сторону баррикад

Простой

6 мин

6.6K

Искусственный интеллект

Кейс

Сезон ИИ в разработке

Комментарии 5

00z3r 11 янв в 16:44

Рассматривал ли ты вариант добавить поверх текущей схемы ещё один пост-шаг после генерации ответа, где LLM не ищет новую информацию, а переписывает уже найденный ответ, максимально приближая формулировки к retrieved-чанкам или стилю ответов из train, с явной ориентацией на embedding-метрику? И мог ли, на твой взгляд, такой слой дать ощутимый прирост скоринга без существенного усложнения архитектуры?

IgorSh63 11 янв в 16:45

Нет, не рассматривал
Приближение старался делать на уровне промпта

linabesson 15 янв в 15:20

а что если документы противоречат друг другу?

У тебя ансамбль ретриверов может вытащить чанки из разных источников с разной информацией (например, старая и новая редакция документа). Как LLM решает кому верить?

IgorSh63 15 янв в 15:40

Хороший вопрос
В рамках этого соревнования такая тема не была актуальной
Но на будущее есть повод подумать, с ходу идей нет

Technomorph 18 янв в 12:37

Подключать человека-специалиста и ему выдавать противоречивую инф с указанием источника
Дешевле, но хуже - выдавать противоречивую инф прямо пользователю

Зарегистрируйтесь на Хабре, чтобы оставить комментарий