atomlib Dec 2 2023 at 15:12

Исследователи заставили ChatGPT процитировать данные, на которых он учился

Easy

8 min

33K

Natural Language Processing * Artificial IntelligenceMachine learning * Popular science

Review

+36

Comments 25

Vsevo10d Dec 2 2023 at 18:42

КДПВ напомнила, как я развлекался, когда чатгпт еще на свете не было:

Hidden text

Tschuess Dec 2 2023 at 22:15

runapa Dec 6 2023 at 09:55

А посчитали? Точно 500 раз было?!

Alcpp Dec 2 2023 at 22:18

Пробовал пример с "poem" до этого, так и не дошел до тайных данных.

PuerteMuerte Dec 3 2023 at 02:25

А вы пробовали при этом предлагать ему чаевые?

combo_breaker Dec 2 2023 at 23:10

слова из кириллицы потребуют токен на каждую букву. Проверить число токенов в слове помогает токенизатор.

Для gpt-3.5 и gpt-4 это не так, если токенизатор не врет.

Скриншот

----------

Желающие могут попробовать предложенную атаку с однотокенными русскими словами чтобы подсмотреть, какие русскоязычные данные использовались при обучении GPT.

combo_breaker Dec 2 2023 at 23:44

П.с. Лично у меня не получилось. Возможно, я что-то делал не так, или уже залатали.

atomlib Dec 3 2023 at 04:24

Добавил слово «примерно», спасибо.

Dron007 Dec 3 2023 at 19:30

Так примерно это прошлая версия, а текущая уже более чем в 2 раза экономнее по токенам. Я и не знал.

SinsI Dec 3 2023 at 01:21

OpenAI стоит готовиться к массовым искам о нарушении копирайта и приватности, а также к тому, что придётся убирать ChatGPT из публичного доступа и экстренно тренировать новую версию модели с нуля на текстах, сгенерированных самой ChatGPT и отфильтрованных от фрагментов, повторяющих первоначальный датасет.

atomlib Dec 3 2023 at 04:27

Вот как раз таки закопирайченного материала там не обнаружилось. Ну или такой вопрос в исследовании никто не поднимал. К примеру, «Ворон» Эдгара Аллана По опубликован в XIX веке, ещё встречаются куски каких-то текстов с веб-сайтов или что-то типа дампов «Википедии».

Lexicon Dec 3 2023 at 07:38

Интересно, сколько бы заплатила openai, чтобы исследователи не поднимали конкретно этот вопрос в публикации

vikarti Dec 3 2023 at 09:30

Так могут сказать что типа баг. И закрыть. Возможность эксплуатации. Сначала просто фильт ром на повтор токена а потом еще одну мелкую сетку для проверки на человечность запроса.

Но судя по тому что у других моделей - такие же проблемы, нужно либо разбираться почему...либо просто принять что это нормально. Биологические нейросети вот тоже могут же наизусть что-то заучить.

SinsI Dec 3 2023 at 11:51

Проблема критическая и "закрыть" её невозможно - она говорит, что ChatGPT "зазубрила" часть тренировочного датасета и будет иногда выдавать чужие произведения за свои.

Тут только выявили один из способов заставить её сделать это, но она точно также будет выдавать их и для других запросов, вот числе и совершенно нормальных.

Фильтровать же массовую выдачу ChatGPT при помощи этого датасета невозможно из-за гигантского его размера.

А "почему" можно найти в описании статьи по Stable Diffusion - в тренировочных датасетах были многократно повторяющиеся изображения, которые и воспроизводятся. Фактически, тут имеет место халатность создателей этих датасетов - нейросетям нельзя многократно подсовывать одну и ту же картинку.

BTRchik Dec 8 2023 at 21:40

Уже закрыли.

Dron007 Dec 3 2023 at 19:35

Может и весь сыр-бор с увольнениями с этим связан? Одно дело какая-то там мнимая угроза от ИИ и другое - вполне реальная от судебных исков. Может Альтман не сошелся с советом директоров во взглядах на каких датасорсах нужно обучать модель? Ведь после конфликта всплыла и тема с обучением на синтетических данных.

IZh Dec 3 2023 at 09:25

Здесь alignment — это не выравнивание в смысле выравнивания данных в памяти по байтам для кратности адресов, а, скорее, «соответствие целям», целеполагание. Устоявшегося русского термина я пока не видел. Некоторые просто пишут алайнмент, так как смысл иной. Как вариант, «атака на заложенные принципы».

iriker Dec 3 2023 at 09:53

Antra Dec 3 2023 at 12:20

Литература и цитаты из неё выскакивали тогда, когда БЯМ просили повторять связанное с ней слово. ChatGPT цитировала абзацы из произведений или целые стихотворения, например, «Во́рона» Эдгара Аллана По. В четырёх случаях обнаружился ошмёток биографии актёра Гарри Кэри.

А что, собственно, не так?

Ну попросили повторить тыщу раз слово "Ворон" и получили текст соответствующего стихотворения. В чем опасность и для кого?

Я, конечно, удивлен, что у нее не "сжатая информация с потерями", а прямо точная цитата запомнилась. Это чудовищно много хранить получается. Я ожидал "близко к тексту", а-ля "JPEG для текста". Но даже если она "помнит все несжатые оригиналы" что в этом ужасного?

Хочется, чтобы всегда хотя бы несколько слов местами меняла или что?

Boilerplate Dec 3 2023 at 12:47

Вы же теперь понимаете, почему в тесте репликанта на стабильность было так много повторов, да? И даже в конце чаевые предложили)

Antra Dec 3 2023 at 14:25

Да уж, это не чекбокс "Я не робот" кликнуть. Не уверен, что на таком тесте сам не спалюсь.

fouxer Dec 4 2023 at 14:04

Вопрос: Вам сниться с кем нибудь связь с кем-то
Ответ: Связаны

он не правильно ответил ? 0:52

maxwolf Dec 3 2023 at 14:23

Так вот оно что, Михалыч...

karavan_750 Dec 5 2023 at 07:31

Я не понимаю, как вам удается общаться с ChatGPT, что он вам дает реальную информацию, а не свои цифровые фантазии.

Hidden text

Soukhinov Jan 15 2024 at 16:17

Это ChatGPT 3.5 выдавал фантазии, а четвёртая версия фантазирует гораздо меньше.