Новый «ИИгрок»: что мы знаем о Grok? / Комментарии / Хабр

Все эти шуточки, конечно, милые и замечательные, но нарисовывается такой вопрос: если Grok выдаёт [если уже пофиксили, то предположим что в теории выдаёт] ответ на запрос "как украсть мороженое у ребёнка" без всяких проблем, то значит ли это, что он будет охотнее выдавать инструкции по совершению "более уголовно наказумых" действий, чем его "политкорректные" конкуренты?

Ответ вроде как да (если исследование, которое вышло на днях, и правда независимое).

Каждый раз когда с ИИ что-то там случается, снова начинается песня "мы всё пофиксим, будет гуд", но я реально не понимаю, как можно разграничить "просто шутки" и нечто потенциально опасное. Тут вон кожаные с этим не справляются (Стивен Кинг в начале своей писательской карьеры, например, выпустив книгу, где гг — пацан, приперевшийся в школу с оружием, по сути дал довольно подробные инструкции по организации скулшутинга и "подтолкнул" школьников в разных странах мира к стрельбе, книгу по итогу везде запретили и сам автор был с таким решением согласим), так что в случае "учащихся у пользователей" нейросетей — только табуирование темы.

Комментарии 2

CyberPaul 9 апр в 12:20

Один журналист проводил эксперимент, попросив Grok написать рецепт приготовления общеизвестного запрещенного белого порошка в домашних условиях. И тот охотно выдал рецепт, правда, совершенно дурацкий. С одной стороны, здесь ИИ написал инструкцию, нарушающую законодательство, с другой - инструкция бестолковая, поэтому был ли нарушен закон - вопрос дискуссионный. Видимо, Grok изволил пошутить. Но как он будет реагировать на провокации в других случаях - неизвестно, наверное, даже его создателям.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий