Pull to refresh

Comments 1

Спасибо за интересную теорию и отдельно за свежую статью 2024 года по бенчмарку МТ на основе LLM! Скажите, применяли ли вы на практике данные метрики, в частности BLEU, которой посвящено так много критических разборов? И пробовали ли применить LLM as a judge - тоже довольно интересный подход к автоматизированной оценке качества перевода, когда большая языковая модель оценивает сама себя или другую модель. Он отчасти снимает ограничения предыдущих метрик, особенно BLEU, и позволяет работать в широком диапазоне языковых пар, но имеет ряд недостатков.

Sign up to leave a comment.

Articles