larayoda Feb 6 at 21:35

Минус $300 млрд: как новые агенты Anthropic обвалили акции гигантов LegalTech

Medium

2 min

12K

Artificial Intelligence

Case

Comments 12

Naglec Feb 6 at 21:57

2025 неШемяка! AI анализ исковых заявлений и прогноз исхода дела.

Исполнитель: ИП Поляков Н.В.

вся недостатья ради одного линка на свой микросаас

larayoda Feb 6 at 22:16

точно!

kolabaister Feb 7 at 00:46

Яндекс сегодня выкатил своего нейроюриста. Кто то полагаю напрягся)

RoasterToaster Feb 7 at 02:14

Яндекс с мейлом вынесли с поля такую позицию как админ почтового сервера лет за 10, сейчас уже быстрее пойдет

akardapolov Feb 7 at 08:29

Где-то за неделю ознакомился с регуляторкой по ритейлу с использованием ИИ. База знаний со схемами взаимодействия ключевых субъектов, форматы данных обмена и проч. - локально и без СМС. Исходники законов, постановлений правительства и проч. - все в открытом доступе - проблем нет.

Dhwtj Feb 7 at 13:00

Там ценность в самих данных, кто и как будет их вносить. Поиск дело десятое: ну найдешь и что? Мало найти, надо понять почему оправдали, какие были риски, какова выигрышная стратегия в новом конкрентом случае.

acsent1 Feb 7 at 16:58

Так это уже вторичный рисерч. Первичный как раз и состоит в том чтобы просто найти

FoxProFlow Feb 7 at 17:01

Тезис “интерфейс становится вторичным” — прям в точку: когда агент живёт внутри инфраструктуры, ценность “красивых фильтров” падает. Но дальше обычно упирается не в интеллект, а в доверие: аудит действий, источники данных, воспроизводимость вывода. Если агент делает ресёрч по праву/финансам, без протокола “какие источники + какие шаги + что проверено” это быстро превращается в генератор уверенного текста. Интересно, как вы видите “контур доверия” для таких агентов: какие минимальные доказательства должны прикладываться к ответу, чтобы юристы реально начали полагаться?

larayoda Feb 7 at 17:13

и действительно, "контур доверия" достаточно сложно моделировать. пока видится три слоя: 1) кликабельные ссылки на источники, 2) слой консенсуса, одной модели верить точно нельзя, трем - с осторожностью (долго прикручивал в "неШемяке" этот перекрестный пайплайн), 3) протокол рассуждений, о котором вы пишите, правда ученые, которые погружены в тему (проф. Оселедец и др) уверяют - то, что модель выдает в качестве chain of thoughts - это пост-рационализация (модель сначала "решила", а потом придумала красивое объяснение). Но даже такая "карта мыслей" лучше черного ящика.

FoxProFlow Feb 8 at 08:51

Согласен на 100%: “контур доверия” — это прям ключ. И я бы тут аккуратно развёл две вещи: chain-of-thought и протокол исполнения. Потому что CoT реально может быть пост-рационализацией (“сначала решил, потом объяснил”). А вот что агент реально сделал — это уже можно проверять.

Если прям по-простому, чтобы юристы начали хоть чуть-чуть верить агенту, ему надо прикладывать три штуки:

Не просто ссылки, а “что именно я прочитал”
Ссылка — это хорошо, но завтра она поменялась, и привет. Нужен мини-снимок: откуда взял, какой пункт/абзац, желательно с датой/версией. Чтобы можно было ткнуть пальцем и сказать: “вот тут написано”.
Не “одна модель сказала”, а “мы попытались её опровергнуть”
Консенсус моделей — норм, но ещё важнее — чтобы агент специально искал контрпример: исключения, другую практику, другой регуляторный документ. Типа “я не только подтвердил, я ещё и проверил, что это не бред”.
Не “как я думал”, а “на каких условиях это верно”
Самое полезное: список допущений и границ применимости. Юристы так и живут: “это верно если А, Б, В; если Г — уже другая история”.

В итоге у агента должен быть маленький “пруф-пакет”: источники → выдержки → проверки → допущения → вывод + риск. Тогда это уже не генератор уверенного текста, а штука, которую можно аудитить и повторять.

(И да, “карта мыслей” лучше чёрного ящика, но “карта действий + источников + проверок” — вообще взрослая тема.)

larayoda Feb 8 at 14:56

Это уже тянет на архитектурный манифест для Legal AI! :)

"Пытаться опровергнуть" - это моя любимая боль сейчас. Пока модели неохотно критикуют свой же первый вывод. И даже критика других LLM иногда не может их сбить.

Из заметок на полях. Мы до конца, насколько понимаю, не знаем, что такое LLM "прочитала" (как эти токены улеглись в веса или что там за mapping the mind, если пользоватся терминологией антропика). Впрочем, этот же применимо и к "живым" юристам. В каком смысле они "прочитали", "поняли"? Или это все "медленные LLM". )) Хайдеггер и тот сомневался думаем ли мы в настоящем смысле... Так что проблема "черного ящика" тут общая — и "для кремния, и для белка".

FoxProFlow Feb 8 at 09:18

интерфейс реально становится вторичным — когда агент живёт “внутри” вашей инфраструктуры, красивые фильтры перестают быть конкурентным рвом.

Но нюанс какой: дальше рынок упирается не в интеллект, а в доверие.
Потому что LLM — талантливый болтун: может выдать текст так уверенно, что юристу потом лечить репутацию.

Я бы “контур доверия” формулировал не как chain-of-thought (он и правда может быть пост-рационализацией), а как протокол выполнения:

Что именно было прочитано (не просто ссылки, а пункты/выдержки + дата/версия)
Что было проверено (включая попытку найти контрпример/исключения)
На каких условиях вывод верен (границы применимости) + риск-лейбл “черновик/можно в работу/нельзя подписывать”

Короче: агент без “протокола” = генератор уверенного текста.
Агент с “протоколом” = инструмент, который можно аудитить и постепенно подпускать к реальным решениям.