Pull to refresh

Comments 1

Тестировал qwen3 0.6b против bge-m3. Особого прироста качества не заметил, кроме большого контекста. MRR даже пониже стал, но я не файнтьюнил под домен. Зато значительно медленнее и жрет больше памяти. 32к длины контекста обычно все равно не используется в моих данных, т.к. такой объем текста можно поделить на меньшие куски без особой потери смысла.

Sign up to leave a comment.

Articles