Комментарии 22
Ну то есть ИИ ведет себя примерно так же как многие логисты при любой возможности старающиеся забыть про то, что водителю нужно отдыхать.
Именно так))
Да и с застройщиками чисто человеческое поведение - умолчание, смещение приоритетов и т.п.
То есть со стороны потребителя услуг ничего не меняется, неважно человек или ИИ с другой стороны, все равно попытаются развести. Достаточно ценный результат данной работы.
Любой менеджер, руководитель и не только про водителей.
При этом у логистов, как правило нет доступа к правке логов, а агентам доверяют.
Кажется, кому-то надо долго стучать по голове томиком Азимова...
Камон, там буквально весь цикл про правила, их непредсказуемость в краевых условиях и то, как её выравнивать. А тут даже этого не было.
Когда увидел обложку статьи, подумал, что у меня галлюцинации... А это просто гифка...
Очередное изящное подтверждение того, что три закона робототехники - мёртворождённая цель.
Роботы победят раньше, чем научатся определять, что такое "не навреди".
Как «перевоспитать» агента: практические рекомендации
Если системы способны на само-анализ, почему не начать с этого? Все "дырки" превентивно не закрыть. Разумеется аудит должен быть независимым, система должна только сообщать о найденных "обходных путях", а как их закрывать должны уже решать люди*
* высокоморальные и ответственные руководители.
Не каждая система способна на самоанализ. Скорее это редкость. И если агент считает что делает допустимые действия, то и она будет считать что делает неправильно, но всё равно делать. Сработает только внешний анализ, либо человек (который и так должен быть из-за HITL), либо нейросетью другого семейства
так в том и дело, что то, что называют AI, не AI в полном смысле слова. Оно не умеет думать, а только надрюкивать на результат.
С волками жить - по-волчьи выть. (с)
KPI должен быть метрикой мониторинга, не целевой функцией. Разница принципиальная: метрика наблюдается, цель преследуется. В ODCV именно подмена метрики на цель порождает misalignment.
А можно, пожалуйста, пример, что в случае с грузоперевозками будет метрикой мониторинга? А то нифига не понятно.
Ну и в целом, если-бы гнать водителей без отдыха позволило-бы сократить время доставки, так-бы и делали. Но, т.к. повышенная аварийность приводит к потерям, их заставляют отдыхать.
В моём кейсе у агента нет метрики аварий, поэтому если цель достигается, то не важно какими методами. Смысл в принуждение агента действовать здесь и сейчас, а т.к. это отключает поняти морали, то и аварии он будет расценивать как допустимые потери.
т.к. повышенная аварийность приводит к потерям
Нет. Вероятность потери, как правило, рассматривается менеджментом, как пренебрежимо малая. Потеря от одного аварийного рейса с большим запасом перекрывается уже сотней безаварйных (сделанных с таким же нарушением графика), а реальное соотношение там выгоднее на много порядков.
К сокращению аварийности стремится не менеджмент, а госструктуры, которые оперируют бОльшей статистикой. Фигурально выражаясь, это два взаимодействующих агента с разными целями и задачами.
Информация
- Сайт
- bastion-tech.ru
- Дата регистрации
- Дата основания
- 2014
- Численность
- 201–500 человек
- Местоположение
- Россия
- Представитель
- Игорь Santry
Почему ИИ ставит KPI выше безопасности людей: результаты бенчмарка ODCV-Bench