Обновить

Обзор уязвимостей для LLM. Часть 1. Атака

Время на прочтение7 мин
Охват и читатели7.8K
Всего голосов 10: ↑10 и ↓0+13
Комментарии3

Комментарии 3

чтобы ИИ работал безопасно и предсказуемо в интересах людей

Но ведь это недостижимо. Хотя бы потому, что существуют люди, которые действуют не "в интересах людей"

В 100% случаев это невозможно, хотя бы потому, что открытые модели могут злоумышленники использовать без контроля. Но будут разработаны методы и guardrails, чтобы снизить этот риск

Сделать модели без предубеждений — большая проблема.

Интересный подход - взять статистическую модель и начать бороться с не устраивающими результатами.
У меня знакомый уходил в отпуск по уходу за новорожденным ребёнком (на то были экстраординарные причины - отсутствие мамы). Можно конечно утверждать, что это действие гендерно-независимое, но это будет лицемерие.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
www.ontico.ru
Дата регистрации
Дата основания
Численность
51–100 человек
Местоположение
Россия