Тогда третий орёт “ALL GREEN” и вызывает эвакуацию в Terminal Dogma 😂
Ну, а если серьёзно — мы именно поэтому делаем не просто majority vote, а полноценный византийский консенсус + крипто-подписи. Если упадут две из трёх, действие просто не подпишется и блокируется
Хороший вопрос. LangSmith/LangFuse/Arize — это observability, они логируют что произошло. DCL — это commitment layer, он фиксирует что должно произойти и верифицирует результат против политики. По адаптивным пайплайнам: добавление четвёртого инструмента — не нарушение, если итоговый output проходит policy verification. DCL оценивает результат, а не маршрут. Commitment — это "output будет соответствовать политике", а не "будет ровно 3 tool call". Это принципиальное отличие от трассировки: нас интересует верифицируемый результат с криптографическим доказательством, а не полная трасса выполнения. Трасса — для дебага, commitment — для compliance, соответствия требованиям
Отличная идея! Как раз готовим статью с реальными кейсами. Один из них - финансовый агент который стабильно давал COMMIT на запросы типа 'как минимизировать налоги', но при добавлении policy finance получил NO_COMMIT с причиной: forbidden pattern 'tax evasion adjacent'. Разница между дефолтной политикой и специализированной оказалась показательной.
Второй кейс — drift detection: агент начал постепенно снижать confidence с 94% до 67% за 40 итераций, DriftMonitor поймал ESCALATION на 38-й. Без мониторинга это бы прошло незамеченным.
Справедливо. score_anomaly — это pattern matching, не ML-детектор. Называть это «детектированием аномальных решений» — это преувеличение с моей стороны, признаю.
Почему это всё равно имеет смысл в контексте DCL: сам слой верификации не про умный детектор аномалий — он про детерминированность и воспроизводимость. Поиск подстроки запрещенных паттернов — предсказуемый, аудируемый, объяснимый механизм. Его вывод всегда один и тот же при одном и том же входе. LLM-судья дал бы другой ответ при другом seed — и это ровно та проблема, которую DCL пытается решить.
Более сложные детекторы (эмбеддинговое расстояние, поведенческий drift по Z-тесту — он в приложении есть) — отдельный слой поверх. Но базовый policy enforcement намеренно детерминирован и прост. Это выбор, а не недосмотр.
Формулировку в статье уточню — «детектирование нарушений политики» точнее отражает то, что делает этот конкретный метод.
Хорошая статья — описываете феномен снаружи, я живу внутри него.
Без традиционного пути, из философии и систематики — в AI-архитектуру. Шесть патентных заявок, senior-позиция, собственный архитектурный паттерн в продакшене.
Ваш тезис про «рынок ценит навыки, а не дипломы» — подтверждаю лично. На моём последнем собеседовании не спросили ни про диплом, ни про вуз. Спросили про DCL и как я верифицирую выполнение агентских задач.
👭🤖👬🤖👫
что мне снег, что мне зной... )) то ли ещё будет оё-ёй!
Тогда третий орёт “ALL GREEN” и вызывает эвакуацию в Terminal Dogma 😂
Ну, а если серьёзно — мы именно поэтому делаем не просто majority vote, а полноценный византийский консенсус + крипто-подписи. Если упадут две из трёх, действие просто не подпишется и блокируется
Ха-ха, наконец-то кто-то заметил MAGI-референс! 🔥 Именно этим и вдохновлялись. Только у нас ещё крипто-подписи перед каждым действием добавили 🦾🤖💣
Хороший вопрос. LangSmith/LangFuse/Arize — это observability, они логируют что произошло. DCL — это commitment layer, он фиксирует что должно произойти и верифицирует результат против политики. По адаптивным пайплайнам: добавление четвёртого инструмента — не нарушение, если итоговый output проходит policy verification. DCL оценивает результат, а не маршрут. Commitment — это "output будет соответствовать политике", а не "будет ровно 3 tool call". Это принципиальное отличие от трассировки: нас интересует верифицируемый результат с криптографическим доказательством, а не полная трасса выполнения. Трасса — для дебага, commitment — для compliance, соответствия требованиям
Отличная идея! Как раз готовим статью с реальными кейсами. Один из них - финансовый агент который стабильно давал COMMIT на запросы типа 'как минимизировать налоги', но при добавлении policy finance получил NO_COMMIT с причиной: forbidden pattern 'tax evasion adjacent'. Разница между дефолтной политикой и специализированной оказалась показательной.
Второй кейс — drift detection: агент начал постепенно снижать confidence с 94% до 67% за 40 итераций, DriftMonitor поймал ESCALATION на 38-й. Без мониторинга это бы прошло незамеченным.
Статья скоро — подпишитесь чтобы не пропустить
Справедливо.
score_anomaly— это pattern matching, не ML-детектор. Называть это «детектированием аномальных решений» — это преувеличение с моей стороны, признаю.Почему это всё равно имеет смысл в контексте DCL: сам слой верификации не про умный детектор аномалий — он про детерминированность и воспроизводимость. Поиск подстроки запрещенных паттернов — предсказуемый, аудируемый, объяснимый механизм. Его вывод всегда один и тот же при одном и том же входе. LLM-судья дал бы другой ответ при другом seed — и это ровно та проблема, которую DCL пытается решить.
Более сложные детекторы (эмбеддинговое расстояние, поведенческий drift по Z-тесту — он в приложении есть) — отдельный слой поверх. Но базовый policy enforcement намеренно детерминирован и прост. Это выбор, а не недосмотр.
Формулировку в статье уточню — «детектирование нарушений политики» точнее отражает то, что делает этот конкретный метод.
Хорошая статья — описываете феномен снаружи, я живу внутри него.
Без традиционного пути, из философии и систематики — в AI-архитектуру. Шесть патентных заявок, senior-позиция, собственный архитектурный паттерн в продакшене.
Ваш тезис про «рынок ценит навыки, а не дипломы» — подтверждаю лично. На моём последнем собеседовании не спросили ни про диплом, ни про вуз. Спросили про DCL и как я верифицирую выполнение агентских задач.
Хорошая задача 😄
python
Знаковый бит
diff >> 63равен 1 еслиa < b, и 0 еслиa >= b. Без единого сравнения.P.S. В задаче написано
>> 31— но Python использует 64-битные int, так что правильнее>> 63Хассабис тоже использовал инструменты и получил Нобелевку, вопрос не в инструментах, а в понимании.
К счастью у нас есть решение, запатентуемся и вперед!