Comments 1
Тестировал qwen3 0.6b против bge-m3. Особого прироста качества не заметил, кроме большого контекста. MRR даже пониже стал, но я не файнтьюнил под домен. Зато значительно медленнее и жрет больше памяти. 32к длины контекста обычно все равно не используется в моих данных, т.к. такой объем текста можно поделить на меньшие куски без особой потери смысла.
Sign up to leave a comment.
Retrieval в 2026: как RAG переехал с энкодеров на LLM (и что с этим делать в своём проекте)