Как научить AI-судью предсказывать решения / Хабр

Классический Legal Judgment Prediction почти всегда обучается на готовых "юридических фактах" - тех самых установленных судом обстоятельствах, которые попадают в мотивировочную часть решения. Но для юриста или бизнеса важен прогноз до того, как суд все это отфильтровал: на руках есть только набор взаимно противоречивых документов, а не аккуратный список фактов.

В свежем препринте предложили формализовать недостающее звено для "AI‑судей" - предсказывать факты (Legal Fact Prediction) и датасет LFPBench, который имитирует реальный сценарий "есть только доказательства, решения еще нет". Эту архитектуру - сначала восстанавливаем факты, потом применяем право - постепенно внедряю в "неШемяку!", почему бы об этом не рассказать...

Авторы исследования "Legal Fact Prediction: The Missing Piece in Legal Judgment Prediction" (EMNLP 2025) наглядно показали, что если просто скормить модели "сырые" доказательства и попросить предсказать исход, качество резко проседает относительно идеализированного сценария "когда у нас уже есть факты из решения". Это делает большинство академических LJP‑результатов с высокими цифрами на "чистых фактах" слабо применимыми в продакшене.

Исследователи предлагают добавить недостающее звено - с��ой Legal Fact Prediction (LFP). Процесс становится двухшаговым: сначала AI по сырым документам восстанавливает, какие факты с высокой вероятностью будут признаны судом установленными, а уже потом применяет к ним нормы права и прогнозирует исход. Такой подход позволяет значительно сократить просадку по качеству по сравнению с прямой схемой "документы → сразу решение".

Один из показательных результатов: специализированные "юридические" модели на базе Llama уступили топовым general‑LLM вроде GPT и Claude. Для восстановления фактов критична не столько "начитанная юрбаза", сколько способность к сложному reasoning - понять, кто что сделал, где противоречия и как выстраивается цепочка событий.

Отсюда и практический вывод для LegalTech. Эффективнее строить системы, которые сначала помогают собрать нарратив "как это, скорее всего, увидит суд", а уже затем оценивают шансы и подбирают правовые аргументы.

Само исследование

Всем хороших выходных!