Комментарии 3
чтобы ИИ работал безопасно и предсказуемо в интересах людей
Но ведь это недостижимо. Хотя бы потому, что существуют люди, которые действуют не "в интересах людей"
Сделать модели без предубеждений — большая проблема.
Интересный подход - взять статистическую модель и начать бороться с не устраивающими результатами.
У меня знакомый уходил в отпуск по уходу за новорожденным ребёнком (на то были экстраординарные причины - отсутствие мамы). Можно конечно утверждать, что это действие гендерно-независимое, но это будет лицемерие.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Обзор уязвимостей для LLM. Часть 1. Атака