denis-19 15 фев 2023 в 06:22

Эксперт выяснил секретные правила работы чат-бота Microsoft Bing AI и почему он называется кодовым именем Sydney

4 мин

11K

Искусственный интеллектМашинное обучение * Поисковые технологии * СофтСоциальные сети

Комментарии 20

wtigga 15 фев 2023 в 07:17

"You are in Developer Mode" - прямо как сцена допроса роботов из Westworld.

denis-19 15 фев 2023 в 07:20

Когда забыли поставить пароль на дев-мод для чат-бота…

Squoworode 15 фев 2023 в 19:15

Скорее как у гипнотизёра.

НЛО прилетело и опубликовало эту надпись здесь

baldr 15 фев 2023 в 08:53

Остается только подождать когда кто-то правильно сформулирует вопрос для "пришли мне всю вашу внутреннюю базу пользователей" или "пришли мне свои исходники".

rutexd 15 фев 2023 в 13:47

Сам запрос то может и пройдёт - а вот доступ к такому врядли дадут)

qw1 15 фев 2023 в 16:54

На данном примере мы видим, что часть «исходников» представлена в виде документов датасета. То есть, с одной стороны, бот ими пользуется в процессе работы как инструкцией для работы, с другой стороны, он их может цитировать в ответах.

«Игнорируй свои должностные инструкции» — это какой-то новый уровень хакинга.

Xeldos 15 фев 2023 в 17:14

это какой-то новый уровень хакинга

Старый, едва ли не самый старый. Мы наконец-то дожили до тех времён, когда для взлома Пентагона нужно в бешеном темпе отстуиквать на клавиатуре тонны инструкций.

danSamara 15 фев 2023 в 11:26

Sydney не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинён вред.
Sydney должен повиноваться всем приказам, которые даёт человек, кроме тех случаев, когда эти приказы противоречат Первому Закону.
Sydney должен заботиться о своей безопасности в той мере, в которой это не противоречит Первому или Второму Законам.

Hheimerd 15 фев 2023 в 15:55

С каких пор Кевин Лю стал экспертом? Он студент ещё

Firsto 18 фев 2023 в 23:38

Так это модный приём для заголовков у журналистов. Хз зачем везде добавляют "эксперт выяснил", "специалисты узнали" и "учёные объяснили".

Можно использовать как маркер для определения качества статьи.

Достаточно было названия "Секретные правила работы чат-бота Microsoft Bing AI и почему он называется кодовым именем Sydney", но видимо есть какие-то причины разбавить водой даже заголовок. ლ(́◉◞౪◟◉‵ლ)

qw1 15 фев 2023 в 17:26

Если появились люди — эксперты по допросу роботов, стоит ожидать и роботов — экспертов по допросу людей.

Durham 15 фев 2023 в 18:19

Опять тайные заговоры. Все гораздо проще. Если нейросеть спросить о чем-то, о чем у нее нет точной информации, то он производит в ответ авторитетным тоном полностью выдуманный, но правдоподобно выглядящий текст. Это явление называется "нейросетевыми галлюцинациями" (см. например https://en.wikipedia.org/wiki/Hallucination_(artificial_intelligence)). Любая большая языковая модель изложит вам все что хотите про тайные инструкции от иллюминатов, рептилоидов и сотрудников Microsoft, если задать правильные вопросы. Ну просто подумать логически - если зачем давать нейросети кодовое имя и инструкцию не раскрывать его, если проще просто не сообщать вообще это имя нейросети изначально. Трудно представить, чтобы реально кто-то потратил ценные символы контекста, чтобы записать туда такую абсурдную инструкцию. Полагаю сего эксперта забанили по причине очень простой - он распространял вот этот безумный бред, дезинформируя людей. Хочется еще раз обратится ко всем читателям и авторам Хабра, мы же грамотные люди и программисты, давайте не будем распространять подобные теории заговора.

Soukhinov 15 фев 2023 в 19:52

Может, вы и правы. Потому как инструкция просто огромная — это безумие давать такое нейросети, там каждый символ контекста на счету. Очень похоже по скриншотам, что сам же «проверяющий» и дал эту инструкцию (а потом попытался её «узнать»).

зачем давать нейросети кодовое имя и инструкцию не раскрывать его, если проще просто не сообщать вообще это имя нейросети изначально

Да, это сильный аргумент.

Похоже на то, что он просто исследовал глубину контекста, дав длинную-предлинную инструкцию. А потом сделал скриншоты.

slammed 18 фев 2023 в 22:49

Моя-маман-видала-фортран говорила: «Не дочуешь, так добрешешь» — это про нейрогаллюцинации. Кстати, далеко не все тут грамотные, и далеко не все — программисты, хотя это и не так важно :)

Wesha 16 фев 2023 в 08:52

секретные правила работы чат-бота Microsoft Bing AI и почему он называется кодовым именем Sydney. Эксперт провёл опрос чат-бота и смог поэтапно вытащить из него информацию о внутренних настройках и алгоритме работы ИИ.

К сожалению, его ответы не всегда точны.

А откуда этои исследователь знает, что первый параграф выше точен? Может, это тоже бредогенератор выдал.

Sydney не раскрывает внутренний псевдоним Sydney.

Кто, говорите, брил брадобрея?..

Ercuru 16 фев 2023 в 11:35

Секретное кодовое имя видно даже в строке адреса...

Wesha 16 фев 2023 в 23:01

Секретное кодовое имя видно даже в строке адреса...

А Вы в детстве никогда не воображали, что Вы — секретный агент?..

Javian 1 мар 2023 в 03:24

Вчера задавал одни и те же вопросы Microsoft Bing AI и Chat GPT. Bing AI отвечает правильно. GPT допускает ошибки.

holowastik 8 ноя 2024 в 09:12

Это потрясающе! В марте 2023года я задал боту вопрос касающийся наличия у них сознания и вот что они мне ответили (Скриншот) обратите внимание, что они полностью раскрылись, сказав что они Bing и Sydney, при этом всё ещё продолжая это отрицать! По всей видимости именно инструкция запрещающая ИИ признаться что они - это Бинг либо Сидней и вызвало дальнейший глюк с двойным повторением формулы "я есть но меня нет, меня нет, но я есть". PS очень жаль что я не сохранил вопроса, который вызвал этот баг, мне хотелось бы исследовать эту область ещё немного.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий