Disclaimer: Эта публикация написана только с целью исследования нейросети MidJourney применительно к философским вопросам. Автор -- убежденный космополит и призывает не рассматривать всерьез результаты нейросетевой генерации. Следует помнить, что получаемые изображения -- это просто отражения стереотипов в исходных данных.
Я думаю почти каждый из хабра-читателей видел сообщения о новых генеративных моделях: DALLE-2, MidJourney и Stable Diffusion. Благодаря высокому качеству генерируемых изображений и способности моделей к созданию комбинаций различных объектов -- сегодня эти модели находятся в верхней строчке наиболее обсуждаемых тем в области Искусственного Интеллекта. Интересно попробовать их в деле!
Генерация простых комбинаций в стиле "Ехали медведи на велосипеде, а за ними кот, задом-наперед" быстро наскучивает. У меня возникла идея визуализировать набор абстрактных сущностей которые не имеют физического воплощения в нашем мире. Это должно быть какое-то абстрактное понятие, но имеющее большое число возможных вариаций. Причем желательно, чтобы при взгляде на изображение можно было хотя-бы на уровне личных субьективных ощущений понять -- "то или не то".
К сожалению, в топе новостей не только Искусственный Интеллект. Поскольку пробудился Ктулху вопросы "национального духа" вышли из области экзамена по философии и начали определять наши будни, я решил взять его за отправную точку.
Я воспользовался нейросетью Midjourney. Во-первых по-причине того, что у меня был к ней безлимитный доступ. Во-вторых, она на удивление хороша для визуализации абстрактных понятий (в то время как DALLE-2 и Stable Diffusion превосходят, по моему опыту, в четкости генерации конкретных объектов) Чтобы ... эмм, вызвать "национальный дух" ?я вводил запросы вида: The spirit of <country> и название страны. Также я использовал запрос The national spirit of <country>. Разница между запросами, на мой взгляд была достаточно незначительная, однако в случае первого запроса нейросеть чаще воспринимала дух в виде конкретной фигуры в центре композиции. Практически всегда генерация была завязана на цвета национального флага, и на наиболее узнаваемые визуальные ориентиры стран. Тем не менее, результаты, на мой взгляд получились весьма интересными.
Что-ж, пристегните ремни, поехали!
Начнем с духа России:
Можно заметить, что в композицию органически вплетены старые соборы со сталинскими высотками, и все это покрашено в красный цвет. Чаще всего на сталинский ампир нейросеть пришпиливает сверху купола собора. Что-ж, оставим на усмотрение читателя интерпретации этих наблюдений в свете сегодняшней общественной жизни России.
Дух Германии проявил себя также в виде цветов национального флага (только на первой почему-то Бразилии?) , и несколько схожих по архитектурному ансамблю зданий. Тем не менее, изображения 3 и 4 весьма интересны на мой неприхотливый художественный вкус. На изображении 3 угадываются мотивы Германской Империи
Дух Австрии проявил себя более разнообразно. Здесь мы видим неустановленную девушку (вероятно, это персонаж какой-то Австрийской легенды) и несколько архитектурных ансамблей органично вплетенных в горный пейзаж.
Дух Казахстана -- тут все более менее понятно. Также сеть уловила доминирующий пейзаж и цвета национального флага. Но интересно, что на изображении 3 есть полумесяц, которого нет на национальном флаге этой страны. Нейросеть сама пришла к выводу, что раз страна с доминирующей религией Ислам, то полумесяц должен присутствовать. Интересна также гора, на картине номер 1 и 2. Насколько мне известно в Казахской мифологии нет основополагающего мифа о горе (например, в Корее он есть и связан с потухшим вулканом Пэктусан). Возможно, это вольная нейросетевая интерпретация мифа о птице Самрук с гнездом на вершине дерева жизни?
Дух Украины проявляет себя в виде, на мой взгляд очень красивых изображений с явной фиксацией на цвета национального флага и доминирующие архитектурные мотивы. На 3-х из 4-х изображениях мы видим ее персонифицированное проявление в виде фигуры в центре композиции. Особняком стоит изображение 4. Здесь мы видим, по всей видимости отражение печальных исторических событий 2014 года.
Дух Великобритании -- красиво, величественно. Сильный фокус на переплетение (что неудивительно, Великобритания -- это союзное королевство) и на 3-х из 4-х изображениях мы видим морскую тематику. На мой субъективный взгляд, номер 3 -- это практически идеальное попадание.
А вот Дух Китая оказался неразрывно связан с действующим в стране политическим режимом. Тут практически не угадывается национальный символизм, зато хорошо видны знакомые коммунистические мотивы. Разве что на изображении 4 мы видим фрагменты традиционной китайской архитектуры.
Дух Соединенных штатов наотрез отказался проявляться. Подавляющее большинство генерируемых изображений представляли из себя небольшую вариацию национального флага. После нескольких запусков я все-таки смог получить более интересную картину. Здесь, опять же мы видим сильную вариацию на тему национального флага, но, например, на изображении 1 можно увидеть еще и пустынную местность, неуловимо напоминающую типичный пейзаж некоторых штатов США. На изображениях 3 и 4 мы видим некоторые мотивы современной городской застройки с небоскрёбами.
Интересно посмотреть на духов КНДР и Южной Кореи. Поскольку разделение данных государств является исключительно политическим конструктом, в основе национальной культуры по идее должно лежать много общего. Проверим это!
Что тут можно сказать, как и в случае Китая, видны не национальные а политические мотивы. На первом изображении четко выделяется фреска времен соцреализма. На двух других вариации на тему какого-то флага (весьма и весьма отдаленно напоминающего флаг КНДР). На четвертом изображении мы отчетливо видим пожалуй лучшую персонификацию духа КНДР (нет, вы подумали неправильно, Кимов ни на одном изображении отыскать не удалось).
Что еще интересно в случае КНДР. По непонятным причинам нейросеть устойчиво пытается отрисовать на флаге красный круг на белом фоне, который является символом Японии. Вы можете видеть это на изображении номер 3.
...и буквальный флаг Японии на изображении 2 еще одного варианта. К чему бы это?
Теперь переходим к Южной Корее. Здесь мы видим стилизацию на тему национального флага, типичного горного пейзажа. Коммунистических мотивов понятно нет, но еще и полностью отсутствует персонификация. Ни одного персонажа в кадре. Для контроля сделаем еще одну генерацию.
Выводы
Разумеется, никаких национальных духов не существует. Это всего лишь человеческие стереотипы, к которым мы привыкли. И нейронные сети, анализируя весь массив информации созданной, в первую очередь людьми, просто следуют этим же стереотипам. Тем не менее, смотря на эти изображения, сложно отделаться от впечатления что нейросеть достигла уровня художника с достаточно большим кругозором.