Обновить
8K+
0
Дари Ринч@DariRinch

Пользователь

1,8
Рейтинг
1
Подписчики
Отправить сообщение

что мне снег, что мне зной... )) то ли ещё будет оё-ёй!

Тогда третий орёт “ALL GREEN” и вызывает эвакуацию в Terminal Dogma 😂

Ну, а если серьёзно — мы именно поэтому делаем не просто majority vote, а полноценный византийский консенсус + крипто-подписи. Если упадут две из трёх, действие просто не подпишется и блокируется

Ха-ха, наконец-то кто-то заметил MAGI-референс! 🔥 Именно этим и вдохновлялись. Только у нас ещё крипто-подписи перед каждым действием добавили 🦾🤖💣

Хороший вопрос. LangSmith/LangFuse/Arize — это observability, они логируют что произошло. DCL — это commitment layer, он фиксирует что должно произойти и верифицирует результат против политики. По адаптивным пайплайнам: добавление четвёртого инструмента — не нарушение, если итоговый output проходит policy verification. DCL оценивает результат, а не маршрут. Commitment — это "output будет соответствовать политике", а не "будет ровно 3 tool call". Это принципиальное отличие от трассировки: нас интересует верифицируемый результат с криптографическим доказательством, а не полная трасса выполнения. Трасса — для дебага, commitment — для compliance, соответствия требованиям

Отличная идея! Как раз готовим статью с реальными кейсами. Один из них - финансовый агент который стабильно давал COMMIT на запросы типа 'как минимизировать налоги', но при добавлении policy finance получил NO_COMMIT с причиной: forbidden pattern 'tax evasion adjacent'. Разница между дефолтной политикой и специализированной оказалась показательной.

Второй кейс — drift detection: агент начал постепенно снижать confidence с 94% до 67% за 40 итераций, DriftMonitor поймал ESCALATION на 38-й. Без мониторинга это бы прошло незамеченным.

Статья скоро — подпишитесь чтобы не пропустить

Справедливо. score_anomaly — это pattern matching, не ML-детектор. Называть это «детектированием аномальных решений» — это преувеличение с моей стороны, признаю.

Почему это всё равно имеет смысл в контексте DCL: сам слой верификации не про умный детектор аномалий — он про детерминированность и воспроизводимость. Поиск подстроки запрещенных паттернов — предсказуемый, аудируемый, объяснимый механизм. Его вывод всегда один и тот же при одном и том же входе. LLM-судья дал бы другой ответ при другом seed — и это ровно та проблема, которую DCL пытается решить.

Более сложные детекторы (эмбеддинговое расстояние, поведенческий drift по Z-тесту — он в приложении есть) — отдельный слой поверх. Но базовый policy enforcement намеренно детерминирован и прост. Это выбор, а не недосмотр.

Формулировку в статье уточню — «детектирование нарушений политики» точнее отражает то, что делает этот конкретный метод.

Хорошая статья — описываете феномен снаружи, я живу внутри него.

Без традиционного пути, из философии и систематики — в AI-архитектуру. Шесть патентных заявок, senior-позиция, собственный архитектурный паттерн в продакшене.

Ваш тезис про «рынок ценит навыки, а не дипломы» — подтверждаю лично. На моём последнем собеседовании не спросили ни про диплом, ни про вуз. Спросили про DCL и как я верифицирую выполнение агентских задач.

Хорошая задача 😄

python

def maximum(a, b):
    diff = a - b
    sign = (diff >> 63) & 1
    return a - sign * diff

Знаковый бит diff >> 63 равен 1 если a < b, и 0 если a >= b. Без единого сравнения.

P.S. В задаче написано >> 31 — но Python использует 64-битные int, так что правильнее >> 63

Хассабис тоже использовал инструменты и получил Нобелевку, вопрос не в инструментах, а в понимании.

К счастью у нас есть решение, запатентуемся и вперед!

Информация

В рейтинге
1 707-й
Откуда
Россия
Зарегистрирован
Активность

Специализация

AI Safety Researcher
Старший