Ребята, привет! Спасибо, что поделились опытом, многое на заметку ) я пока не участвовала, но звучит как новая эра соревнований ) учитывая тренды индустрии. Выглядит как гораздо более многогранный и ценный опыт, чем выбивание скора по задаче. Спасибо за инсайты и увлекательный пост )
Спасибо за статью. Особенно понравилась идея про GLiGuard в качестве первой ступени каскада.
На практике такой каскад может оказаться очень сильным компромиссом когда encoder закрывает массовый поток дешево и быстро, а expensive LLM-guard вызывается только на спорных или рискованных примерах.
Было бы интересно увидеть end-to-end метрики каскада - доля эскалаций, итоговый recall по unsafe, latency p95/p99.
Ребята, привет! Спасибо, что поделились опытом, многое на заметку ) я пока не участвовала, но звучит как новая эра соревнований ) учитывая тренды индустрии. Выглядит как гораздо более многогранный и ценный опыт, чем выбивание скора по задаче. Спасибо за инсайты и увлекательный пост )
Спасибо за статью. Особенно понравилась идея про GLiGuard в качестве первой ступени каскада.
На практике такой каскад может оказаться очень сильным компромиссом когда encoder закрывает массовый поток дешево и быстро, а expensive LLM-guard вызывается только на спорных или рискованных примерах.
Было бы интересно увидеть end-to-end метрики каскада - доля эскалаций, итоговый recall по unsafe, latency p95/p99.