Comments 12
2025 неШемяка! AI анализ исковых заявлений и прогноз исхода дела.
Исполнитель: ИП Поляков Н.В.
вся недостатья ради одного линка на свой микросаас
Яндекс сегодня выкатил своего нейроюриста. Кто то полагаю напрягся)
Где-то за неделю ознакомился с регуляторкой по ритейлу с использованием ИИ. База знаний со схемами взаимодействия ключевых субъектов, форматы данных обмена и проч. - локально и без СМС. Исходники законов, постановлений правительства и проч. - все в открытом доступе - проблем нет.
Там ценность в самих данных, кто и как будет их вносить. Поиск дело десятое: ну найдешь и что? Мало найти, надо понять почему оправдали, какие были риски, какова выигрышная стратегия в новом конкрентом случае.
Тезис “интерфейс становится вторичным” — прям в точку: когда агент живёт внутри инфраструктуры, ценность “красивых фильтров” падает. Но дальше обычно упирается не в интеллект, а в доверие: аудит действий, источники данных, воспроизводимость вывода. Если агент делает ресёрч по праву/финансам, без протокола “какие источники + какие шаги + что проверено” это быстро превращается в генератор уверенного текста. Интересно, как вы видите “контур доверия” для таких агентов: какие минимальные доказательства должны прикладываться к ответу, чтобы юристы реально начали полагаться?
и действительно, "контур доверия" достаточно сложно моделировать. пока видится три слоя: 1) кликабельные ссылки на источники, 2) слой консенсуса, одной модели верить точно нельзя, трем - с осторожностью (долго прикручивал в "неШемяке" этот перекрестный пайплайн), 3) протокол рассуждений, о котором вы пишите, правда ученые, которые погружены в тему (проф. Оселедец и др) уверяют - то, что модель выдает в качестве chain of thoughts - это пост-рационализация (модель сначала "решила", а потом придумала красивое объяснение). Но даже такая "карта мыслей" лучше черного ящика.
Согласен на 100%: “контур доверия” — это прям ключ. И я бы тут аккуратно развёл две вещи: chain-of-thought и протокол исполнения. Потому что CoT реально может быть пост-рационализацией (“сначала решил, потом объяснил”). А вот что агент реально сделал — это уже можно проверять.
Если прям по-простому, чтобы юристы начали хоть чуть-чуть верить агенту, ему надо прикладывать три штуки:
Не просто ссылки, а “что именно я прочитал”
Ссылка — это хорошо, но завтра она поменялась, и привет. Нужен мини-снимок: откуда взял, какой пункт/абзац, желательно с датой/версией. Чтобы можно было ткнуть пальцем и сказать: “вот тут написано”.Не “одна модель сказала”, а “мы попытались её опровергнуть”
Консенсус моделей — норм, но ещё важнее — чтобы агент специально искал контрпример: исключения, другую практику, другой регуляторный документ. Типа “я не только подтвердил, я ещё и проверил, что это не бред”.Не “как я думал”, а “на каких условиях это верно”
Самое полезное: список допущений и границ применимости. Юристы так и живут: “это верно если А, Б, В; если Г — уже другая история”.
В итоге у агента должен быть маленький “пруф-пакет”: источники → выдержки → проверки → допущения → вывод + риск. Тогда это уже не генератор уверенного текста, а штука, которую можно аудитить и повторять.
(И да, “карта мыслей” лучше чёрного ящика, но “карта действий + источников + проверок” — вообще взрослая тема.)
Это уже тянет на архитектурный манифест для Legal AI! :)
"Пытаться опровергнуть" - это моя любимая боль сейчас. Пока модели неохотно критикуют свой же первый вывод. И даже критика других LLM иногда не может их сбить.
Из заметок на полях. Мы до конца, насколько понимаю, не знаем, что такое LLM "прочитала" (как эти токены улеглись в веса или что там за mapping the mind, если пользоватся терминологией антропика). Впрочем, этот же применимо и к "живым" юристам. В каком смысле они "прочитали", "поняли"? Или это все "медленные LLM". )) Хайдеггер и тот сомневался думаем ли мы в настоящем смысле... Так что проблема "черного ящика" тут общая — и "для кремния, и для белка".
интерфейс реально становится вторичным — когда агент живёт “внутри” вашей инфраструктуры, красивые фильтры перестают быть конкурентным рвом.
Но нюанс какой: дальше рынок упирается не в интеллект, а в доверие.
Потому что LLM — талантливый болтун: может выдать текст так уверенно, что юристу потом лечить репутацию.
Я бы “контур доверия” формулировал не как chain-of-thought (он и правда может быть пост-рационализацией), а как протокол выполнения:
Что именно было прочитано (не просто ссылки, а пункты/выдержки + дата/версия)
Что было проверено (включая попытку найти контрпример/исключения)
На каких условиях вывод верен (границы применимости) + риск-лейбл “черновик/можно в работу/нельзя подписывать”
Короче: агент без “протокола” = генератор уверенного текста.
Агент с “протоколом” = инструмент, который можно аудитить и постепенно подпускать к реальным решениям.
Минус $300 млрд: как новые агенты Anthropic обвалили акции гигантов LegalTech