Erwinmal 18 июн 2022 в 13:00

Нейросеть DALL-E 2 создала собственный язык: правда, не совсем, и совсем не?

9 мин

38K

Блог компании RUVDS.comИскусственный интеллектМашинное обучение*Научно-популярноеЧитальный зал

+64

Комментарии 14

Refridgerator 18 июн 2022 в 13:28

Авторы, впрочем, осторожны и корректны в выводах. Никакого «созданного нейросетью языка» в их интерпретации нет, лишь некий vocabulary, то есть словарный запас, лексика

А чуть выше написано, что авторы скормили нейросети википедию. Какая неожиданность.

Sadler 18 июн 2022 в 13:42

Естественно, модель будет на любой непонятный ей запрос выдавать результаты, сдвинутые определённым, нестабильным, зависящим от процесса обучения, образом во внутреннем пространстве представлений, ведь выдавать что-то надо. И это отлично согласуется с предложенными в статье фактами о похожести выдачи на опечатки, другие языки и классификацию.

Получился очень наглядный пример работы принципа garbage in, garbage out.

Удивление здесь могла бы вызвать согласованность текстовой выдачи внутри изображения и текстом запроса, если бы мы не знали, что такое сопоставление -- и есть scoring-функция сети, она обучалась именно сопоставлению текстов и изображений, хоть и из более узкого множества языковой лексики.

vassabi 18 июн 2022 в 16:00

ИМХО это чем-то похоже на "неподвижные точки" - текст, который отображается на рисунки с этим же текстом ...

CrazyOpossum 18 июн 2022 в 17:48

Ссылка на фиговый клон википедии случайна?

vassabi 20 июн 2022 в 23:14

извините, был в тот момент в невменяемом состоянии (пищевое отравление)

вот правильная ссылка

phenik 18 июн 2022 в 17:26

Глокая куздра тоже вызывает определенные смысловые ассоциации, в том числе визуальные. Из найденных в сети

Щерба

Другой вариант

Static_electro 18 июн 2022 в 20:04

DALL-E Mini забавная. Она настолько отчаянно отказывается генерить текст, что создается впечатление, будто это специально подрезали. По запросу "advertisement billboard" генерирует чисто белый биллбоард, например :)

Vasyutka 18 июн 2022 в 22:16

Да в общем ничего удивительно, слова проецируются в токены. Причем даже можно подобрать кучу разных написаний (и весьма неожиданных, если брать редкие символы), приводящим к близким токенам. Потом при генерации сетка просто никак не может отличить слово абракодабру от исходного слова (при обучении дискриминтора, например). Апприорно наделили систему дислексией - странно что неправильные слова пишет потом и читает :).

dimnsk 19 июн 2022 в 13:32

c GPU нет серверов у вас ?

Selueen 21 июн 2022 в 14:09

DALLE-mini не связана с Open AI, это независимый опен-соурс проект, вдохновленный первой DALLE. И Open AI сейчас пытаются их вынудить сменить название, чтобы схожесть названий людей в заблуждение не вводила.

Что отчасти объясняет разницу в результатах - это в принципе разные модели)

Ну зато в остальном статья очень даже разумная, все по делу.

nillringil 22 июн 2022 в 11:35

Уже сменили даже

Craiyon, formerly DALL·E mini, is an AI model that can draw images from any text prompt!

OpenAI asked us to change the name of our app which quickly became viral to avoid confusion with their model.

RainAustin 1 июл 2022 в 23:55

Ждём когда ИИ научиться генерировать полноценное кино с видеорядом и диалогами, тогда точно можно будет улететь в мир грёз наяву.

usrsse2 2 июл 2022 в 23:04

А почему в экспериментах использовалось слово vicootes, если на сгенерированной картинке было vicootess (с двумя s)?

Cybermorzh 26 мар 2023 в 13:57

Кажется, мы приближаемся к разгадке языка рукописи Войнича.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий