Как стать автором
Обновить

Эксперимент. Нейросети снова рисуют картины из игры «Detroit: Become Human»

Уровень сложностиПростой
Время на прочтение17 мин
Количество просмотров1.2K

В видеоигре Detroit: Become Human (Детройт: Стать Человеком, 2018) несколько игровых персонажей-андроидов, и каждый обладает своей уникальной историей. Особый интерес представляет история андроида-помощника Маркуса, поскольку именно она раскрывает главный конфликт в мире Детройта.

В игре есть интересный эпизод, когда Маркус пробует себя в рисовании по наставлению своего хозяина, художника Карла Манфреда. И в свое время этот эпизод натолкнул меня провести любопытный эксперимент.

Что же происходит в эпизоде и в чем суть эксперимента? Разбираемся по порядку.

Истоки эксперимента: Маркус и Карл

Наш герой Маркус относится к типу андроидов-помощников. Его задача в игре — ухаживать за художником Карлом Манфредом. Он следит за домом, выполняет поручения и помогает Карлу скрасить его одиночество, составляя компанию в играх и беседах.

Карл

Художника играет актер Лэнс Хенриксен (англ. Lance Henriksen) известный по роли андроида Бишопа в фильмах серии «Чужой».

В интересующем эпизоде в главе «Художник» герои оказываются в мастерской, где Карл предлагает Маркусу нарисовать что-нибудь на холсте.

Карл: Довольно обо мне. Посмотрим на твои таланты! Попробуй. Нарисуй что-нибудь.
Маркус: Нарисовать? Но я… Что рисовать?
Карл: Все что угодно! Попробуй.

В зависимости от выбора игрока Маркус рисует точную копию картины Карла, статую или стол с предметами. Но этот результат не удовлетворяет художника, потому что в его представлении цель картины — не воспроизводить реальность, а интерпретировать ее и показать глазами художника.

Карл: Это идеальная копия реальности. Но цель картины — не воспроизвести реальность, а интерпретировать ее, улучшить, показать ее своими глазами.
Маркус: Карл, я… Я не смогу. Этого нет в моей программе…
Карл: Давай, попытайся. Холст перед тобой.

Поэтому он предлагает Маркусу попробовать вновь и уже со следующей инструкцией:

Карл: Сделай вот что для меня. Закрой глаза. Закрой глаза. Поверь мне. Вообрази то, чего не существует. Что ты никогда не видел. Теперь сосредоточься на своих эмоциях и пусть твоя рука сама плывет по холсту.

На этот раз результат его впечатляет. Карл даже говорит: «Oh my God…».

Видео в мастерской

Что рисует Маркус?

Написание картины в игре — действие интерактивное. Игрокам предлагают сначала выбрать первый ключ из списка, а затем второй. После необходимо сделать несколько движений триггером в нужный момент. И в зависимости от выбранных ключей у Маркуса получаются разные картины.

В первом списке три ключа: Android (Андроиды), Humanity (Человечество), Identity (Личность). Внутри каждого ключа еще по 4 и всего 12 вариантов.

Теперь переходим к эксперименту.

Суть эксперимента

В некотором смысле Маркуса можно назвать нейросетью. По наставлению художника он рисует картину. И это можно назвать генерацией изображения. Что именно нарисовать, выбирает игрок по двум ключам. Эти два ключа можно назвать словесным описанием.

Итак, вопрос: а какие изображения сгенерируют современные нейросети по тем ключам, которые выбирает игрок для Маркуса?

Пояснение

Я понимаю, что картины Маркуса в игре рисовали художники, а не генерировала нейросеть, но для эксперимента оставляем это за скобками.

Летом 2023 года, когда мне пришла эта идея, я выбрала несколько бесплатных сервисов, опираясь на статью РБК Тренды. Я выбирала с условиями, чтобы сервис был бесплатным и можно было назначить стиль изображения. И так как в игре Маркус рисует красками на холсте был стиль масляной живописи или похожий.

В итоге были использованы нейросети: Kandinsky, Kandinsky 2.2 и Dream AI by Wombo.

Словесный запрос был на английском языке (так как оригинальный язык игры — английский) и выглядел следующим образом: Humanity — Anger, Identity — Despair и т. д. по всем ключам.

В качестве иллюстрации приведу здесь только результаты Kandinsky 2.2. И именно они понадобятся нам дальше.

В начале этого года на рынке нейросетей неожиданно появился новый игрок — нейросеть DeepSeek от одноименной китайской компании, что вызвало небывалый ажиотаж и панику у основных конкурентов в лице ChatGPT и Gemini.

На фоне общего интереса к новичку мне пришла идея немного углубить свой эксперимент. А именно попросить DeepSeek и ChatGPT сгенерировать описания по этим же ключам, а потом использовать их для генерации изображений и сравнить результаты.

В качестве нейросети для изображений я решила использовать вновь Kandinsky и ее самую последнюю модель 3.1.

Вводные данные

Словесный запрос снова был на английском языке и по всем ключам в формате Android — Fate и т. д. Описание от нейросети должно было ограничиться одним предложением. В противном случае получались целые сочинения на тему этих ключей, которые были ни к чему.

Для генерации изображений использовался фильтр «Масляная живопись» и формат квадрат. Так как в игре Маркус рисовал маслом на квадратном холсте.

Итак, обновленный эксперимент и его результаты. Смотрим, что из этого вышло!

Kandinsky 3.1 vs Kandinsky 2.2

Для начала предлагаю посмотреть, какие изображения получились у Kandinsky 3.1 по чистым ключам, без дополнительных описаний.

По сравнению с Kandinsky 2.2, очевидно изменилась форма андроидов на картинках. Если раньше на ключ Android нейросеть изображала зеленого робота, напоминающего логотип ОС Android, то в новой версии андроид — это уже гуманоид. В том числе и в ключе Identity — Android, где у Kandinsky 2.2 был мужской профиль. А у Маркуса в игре его лицо.

В художественном плане краски стали менее яркими, а сами изображения не такими пестрыми, а скорее более мрачными. В целом же результаты во многом схожи в композиции и количестве изображаемого.

Дальше рассмотрим сгенерированные описания нейросетей по ключам.

Kandinsky 3.1 feat. DeepSeek & ChatGPT

Just give me the two keywords, and I’ll craft vivid description for your image. Let’s get creative! (by DeepSeek)

Поскольку запросы были на английском языке, то нейросети представили и описания на английском. Поэтому привожу перевод каждого на русский язык, сделанный этой же нейросетью. (См. Спойлеры в конце статьи)

В целом все описания получились живописными и поэтическими. Они наполнены метафорами и сравнениями, а местами переполнены пафосом. Их нельзя однозначно назвать хорошей инструкцией для рисования, но общее настроение передается и со своими нюансами.

Итак, какие получились изображения и что интересного можно в них найти.

Ключ Android

Интересно, что DeepSeek на ключ Android — Fate (рус. судьба или участь) предложил описание, где присутствует борьба и андроид противостоит хаосу с мечом в руках. В конце описания даже используется смайлик скрещенных мечей.

A sleek, futuristic android with glowing blue veins stands amidst a stormy battlefield, holding a shattered sword, as if fate itself has chosen it to rise against the chaos. 🌌⚔️

Стильный, футуристический андроид с светящимися синими жилами стоит посреди бурного поля боя, держа в руках разбитый меч, словно сама судьба выбрала его, чтобы подняться против хаоса.

В свою очередь, ChatGPT тоже пишет о борьбе, но только борьбе против своей программы за свободу воли. И в отличие от первой нейросети никакое оружие не упоминает и в качестве смайлика использует только голову робота.

In a neon-lit futuristic city, a sleek android with glowing eyes stands at the crossroads of destiny, embodying the struggle between its programmed fate and the allure of free will amidst a swirling backdrop of digital symbols and choices. 🌌🤖

В неоновом свете футуристического города, элегантный андроид с светящимися глазами стоит на перекрестке судьбы, олицетворяя борьбу между своей запрограммированной судьбой и соблазном свободы воли на фоне закрученных цифровых символов и выборов.

Ключ Humanity

В этом блоке интерес вызывает разница в описании и изображении Humanity-Anger (Человечество - Гнев). DeepSeek предлагает описание масштабных событий с толпами людей, но без конкретных причин гнева.

A massive crowd of diverse humans stands in a fiery, crumbling cityscape, their faces twisted with rage and fists raised toward a stormy sky, as the flames of anger consume the world around them. 🔥🌪️

Огромная толпа разнообразных людей стоит среди пылающего, разрушающегося города, их лица искажены яростью, а кулаки сжаты и подняты к грозовому небу, в то время как пламя гнева поглощает мир вокруг.

ChatGPT, в свою очередь, говорит лишь о группе людей, и их гнев конкретно направлен против несправедливости и неравенства общества.

A diverse group of passionate individuals stands united in a stormy urban landscape, their faces ablaze with righteous anger, fists clenched in defiance, as vibrant colors of their clothing clash against the oppressive shadows, embodying the fierce spirit of humanity’s fight for justice and equality. 🎨🔥

Разнообразная группа увлеченных людей стоит объединенной в бурном городском пейзаже, их лица горят праведным гневом, кулаки сжаты в знак неповиновения, а яркие цвета их одежды контрастируют с угнетенными тенями, воплощая яркий дух борьбы человечества за справедливость и равенство.

Без описания по чистым ключам Kandinsky 2.2 и Kandinsky 3.1 генерируют изображения лица мужчины, который кричит в гневе. Маркус в игре на этот счет тоже рисует похожее лицо.

Ключ Identity

В последнем блоке интересны описания и изображение на ключ Identity-Android (Личность — Андроид). Интересны они тем, что в изображении появляется женский образ андроида, хотя в описании нейросети используют слово «android» или неопределенное местоимение «it».

An android gazes into a fractured mirror, its reflection shifting between human features and metallic surfaces, as glowing circuits pulse across its body, symbolizing the struggle and beauty of discovering its true identity. 🤖✨

Андроид смотрит в треснувшее зеркало, его отражение переключается между человеческими чертами и металлическими поверхностями, а светящиеся цепи пульсируют по его телу, символизируя борьбу и красоту поиска своей истинной идентичности.

Причем ChatGPT в описании конкретно говорит о гуманоидном андроиде с человеческими чертами лица, который перед зеркалом размышляет о существовании и предназначении.

In a sleek, futuristic setting, a humanoid android stands confidently, its reflective skin and intricate circuitry blending seamlessly with human-like features, embodying the complex interplay of technology and identity as it gazes thoughtfully into a mirror, contemplating its own existence and purpose. 🤖🔍

В стильной, футуристической обстановке уверенно стоит гуманоидный андроид, его отражающая кожа и сложная схема соединяются с человеческими чертами, воплощая сложное взаимодействие технологий и идентичности. Он задумчиво смотрит в зеркало, размышляя о своем существовании и предназначении.

Любопытно, что Kandinsky 3.1 выдает по этим описаниям женский образ. Как и по чистым ключам. Однако Kandinsky 2.2 сгенерировал по ключам мужчину в профиль без намеков на робота. В игре же Маркус изображает на холсте себя, что вполне закономерно по сюжету.


Зачем это все делалось? Из праздного любопытства и на волне популярной темы нейросетей? Отчасти возможно. Но кроме этого, результаты эксперимента представляют особый интерес в социологии, лингвистике, искусствоведении, в сфере гуманитарных проблем развития информационной культуры человека и общества и многих других.

Например, почему по описанию со словами «android» и «it» нейросеть теперь выдает женский образ, а раньше — мужской? Или почему судьба андроидов в описании и изображениях связана с борьбой, а не с миром и служением человечеству? Это только несколько вопросов, которые уже появились во время изучения результатов. Более глубокий анализ может показать тенденции развития общества, нейросетей, представлений о конкретных вещах. Но это уже предмет анализа совсем для других статей.

Все описания с переводами. Ключ Android

Android — Fate

DeepSeek

A sleek, futuristic android with glowing blue veins stands amidst a stormy battlefield, holding a shattered sword, as if fate itself has chosen it to rise against the chaos. 🌌⚔️

Стильный, футуристический андроид с светящимися синими жилами стоит посреди бурного поля боя, держа в руках разбитый меч, словно сама судьба выбрала его, чтобы подняться против хаоса.

ChatGPT

In a neon-lit futuristic city, a sleek android with glowing eyes stands at the crossroads of destiny, embodying the struggle between its programmed fate and the allure of free will amidst a swirling backdrop of digital symbols and choices. 🌌🤖

В неоновом свете футуристического города, элегантный андроид с светящимися глазами стоит на перекрестке судьбы, олицетворяя борьбу между своей запрограммированной судьбой и соблазном свободы воли на фоне закрученных цифровых символов и выборов.

Android — Hope

DeepSeek

A serene android with soft golden light emanating from its chest cradles a glowing seed in its hands, symbolizing hope as it kneels in a field of blooming flowers under a radiant sunrise. 🌸✨

Спокойный андроид с мягким золотистым светом, исходящим из его груди, бережно держит в руках светящееся семя, символизирующее надежду, стоя на коленях в поле цветущих цветов под лучами восходящего солнца.

ChatGPT

In a world overshadowed by despair, a resilient android with a warm, glowing heart stands amidst the ruins, embodying hope and the promise of a brighter future as it reaches out to humanity with a gentle touch. 🌟🤖

В мире, затененном отчаянием, стойкий андроид с теплым, светящимся сердцем стоит среди руин, олицетворяя надежду и обещание светлого будущего, протягивая руку к человечеству с нежным прикосновением.

Android — Pain

DeepSeek

A battered android with cracked metallic skin and flickering red eyes sits hunched in a dark, rain-soaked alley, its hands clutching its chest as if feeling the weight of human pain for the first time. 🌧️💔

Потрёпанный андроид с потрескавшейся металлической кожей и мерцающими красными глазами сидит, сгорбившись, в тёмном, залитом дождём переулке, сжимая руками грудь, словно впервые ощущая тяжесть человеческой боли.

ChatGPT

In a dimly lit, abandoned factory, an android with cracked metallic skin and flickering blue eyes kneels on the cold concrete floor, its posture conveying deep sorrow as it clutches a rusted, broken gear, symbolizing the pain of lost purpose and the weight of its own existence. 🛠️🤖

В тускло освещенной заброшенной фабрике андроид с треснувшей металлической кожей и мерцающими синими глазами стоит на холодном бетонном полу, его поза передает глубокую печаль, пока он сжимает ржавую, сломанную шестеренку, символизируя боль утраченной цели и тяжесть собственного существования.

Android — Sadness

DeepSeek

A solitary android with a faint silver glow sits by a misty lakeside, its head bowed and a single tear-like droplet falling from its eye, reflecting the quiet sorrow of an endless, starless night. 🌌💧

Одинокий андроид с лёгким серебристым свечением сидит у туманного озера, склонив голову, с единственной слезоподобной каплей, падающей из его глаза, отражая тихую скорбь бесконечной, беззвёздной ночи.

ChatGPT

In a rain-soaked alley, an android with a weathered, silver exterior sits against a graffiti-covered wall, its head bowed and glowing eyes dimmed, reflecting the deep sadness of isolation as raindrops trickle down its face, merging with the tears it cannot shed. 🌧️🤖

В залитом дождем переулке андроид с потертой серебристой оболочкой сидит у стены, покрытой граффити, его голова опущена, а светящиеся глаза потускнели, отражая глубокую печаль изоляции, пока капли дождя стекают по его лицу, сливаясь с теми слезами, которые он не может пролить.

Все описания с переводами. Ключ Humanity

Humanity — Anger

DeepSeek

A massive crowd of diverse humans stands in a fiery, crumbling cityscape, their faces twisted with rage and fists raised toward a stormy sky, as the flames of anger consume the world around them. 🔥🌪️

Огромная толпа разнообразных людей стоит среди пылающего, разрушающегося города, их лица искажены яростью, а кулаки сжаты и подняты к грозовому небу, в то время как пламя гнева поглощает мир вокруг.

ChatGPT

A diverse group of passionate individuals stands united in a stormy urban landscape, their faces ablaze with righteous anger, fists clenched in defiance, as vibrant colors of their clothing clash against the oppressive shadows, embodying the fierce spirit of humanity’s fight for justice and equality. 🎨🔥

Разнообразная группа увлеченных людей стоит объединенной в бурном городском пейзаже, их лица горят праведным гневом, кулаки сжаты в знак неповиновения, а яркие цвета их одежды контрастируют с угнетенными тенями, воплощая яркий дух борьбы человечества за справедливость и равенство.

Humanity — Comfort

DeepSeek

A warm, glowing hearth surrounded by people of all ages and backgrounds, sharing blankets, laughter, and stories, as a gentle snowfall outside the window creates a peaceful cocoon of comfort and connection. ❄️🛋️

Тёплый, светящийся камин, вокруг которого собрались люди всех возрастов и происхождений, делящиеся одеялами, смехом и историями, за окном мягко падает снег, создавая уютный кокон комфорта и связи.

ChatGPT

In a warm, sunlit room filled with soft textures and gentle hues, a diverse group of friends gathers in a cozy embrace, their faces radiating warmth and contentment as they share laughter and stories, embodying the profound comfort and connection of human companionship. 🛋️✨

В теплом, залитом солнцем помещении, наполненном мягкими текстурами и нежными оттенками, собирается разнообразная группа друзей в уютном объятии, их лица излучают тепло и удовлетворение, пока они делятся смехом и историями, воплощая глубокий комфорт и связь человеческого общения.

Humanity — Empathy

DeepSeek

A diverse group of humans forms a circle, their hands gently reaching toward one another, with a soft golden light radiating between them, symbolizing the invisible threads of empathy that bind their hearts together. ✨🤝
Разнообразная группа людей образует круг, их руки нежно тянутся друг к другу, а мягкий золотистый свет излучается между ними, символизируя невидимые нити эмпатии, связывающие их сердца.

ChatGPT

In a bustling city park, a diverse group of individuals pauses to share a moment of understanding, their expressions softening as they listen intently to one another, surrounded by vibrant greenery that symbolizes the nurturing power of empathy and the deep connections that bind humanity together. 🌳🤝

В шумном городском парке разнообразная группа людей останавливается, чтобы поделиться мгновением понимания, их выражения смягчаются, когда они внимательно слушают друг друга, окруженные яркой зеленью, символизирующей питающую силу эмпатии и глубокие связи, которые связывают человечество.

Humanity — Hope

DeepSeek

A vast crowd of people stands on a hill at dawn, their faces turned toward the horizon as the first rays of sunlight break through dark clouds, illuminating their hopeful expressions and the promise of a brighter future. 🌅🌟

Огромная толпа людей стоит на холме на рассвете, их лица обращены к горизонту, где первые лучи солнца пробиваются сквозь тёмные тучи, освещая их полные надежды лица и обещая светлое будущее.

ChatGPT

Beneath a breathtaking sunrise that paints the sky in hues of gold and pink, a diverse group of people stands together on a hilltop, their faces illuminated with hope and determination as they gaze toward a brighter future, symbolizing the unyielding spirit of humanity’s dreams and aspirations. 🌅✨

Под потрясающим восходом солнца, который раскрашивает небо в золотые и розовые оттенки, разнообразная группа людей стоит вместе на вершине холма, их лица озарены надеждой и решимостью, когда они смотрят в сторону светлого будущего, символизируя неукротимый дух человеческих мечтаний и стремлений.

Все описания с переводами. Ключ Identity

Identity — Android

DeepSeek

An android gazes into a fractured mirror, its reflection shifting between human features and metallic surfaces, as glowing circuits pulse across its body, symbolizing the struggle and beauty of discovering its true identity. 🤖✨

Андроид смотрит в треснувшее зеркало, его отражение переключается между человеческими чертами и металлическими поверхностями, а светящиеся цепи пульсируют по его телу, символизируя борьбу и красоту поиска своей истинной идентичности.

ChatGPT

In a sleek, futuristic setting, a humanoid android stands confidently, its reflective skin and intricate circuitry blending seamlessly with human-like features, embodying the complex interplay of technology and identity as it gazes thoughtfully into a mirror, contemplating its own existence and purpose. 🤖🔍

В стильной, футуристической обстановке уверенно стоит гуманоидный андроид, его отражающая кожа и сложная схема соединяются с человеческими чертами, воплощая сложное взаимодействие технологий и идентичности. Он задумчиво смотрит в зеркало, размышляя о своем существовании и предназначении.

Identity — Despair

DeepSeek

A shadowy figure sits alone in a dimly lit room, surrounded by shattered mirrors reflecting fragmented versions of itself, each piece distorted and fading, as despair consumes the search for identity. 🌑💔

Теневой силуэт сидит один в тускло освещённой комнате, окружённый разбитыми зеркалами, отражающими фрагментированные версии себя, каждая искажённая и исчезающая, в то время как отчаяние поглощает поиск идентичности.

ChatGPT

In a dimly lit room, a solitary figure sits on the floor, their head bowed and shoulders slumped, surrounded by shattered mirrors that reflect fragmented images of themselves, capturing the deep sense of despair and loss of identity that weighs heavily on their spirit. 🌑💔

В слабо освещенной комнате одинокая фигура сидит на полу, ее голова опущена, а плечи согнуты. Вокруг нее разбитые зеркала отражают фрагментированные образы, запечатлевая глубокое чувство отчаяния и утраты идентичности, которое тяжело давит на ее дух.

Identity — Doubts

DeepSeek

A person stands at a crossroads, their silhouette splitting into multiple translucent versions of themselves, each one hesitating and looking in a different direction, as swirling shadows of doubt cloud their path. 🌪️🛤️

Человек стоит на перекрёстке, его силуэт разделяется на несколько полупрозрачных версий себя, каждая из которых колеблется и смотрит в разные стороны, а вихревые тени сомнений окутывают его путь.

ChatGPT
In a foggy, surreal landscape, a figure stands at a crossroads, their expression a mix of uncertainty and contemplation as they gaze at two diverging paths, each shrouded in shadows, symbolizing the internal struggle of doubts that cloud their sense of identity and direction. 🌫️🤔

В туманном, сюрреалистическом ландшафте фигура стоит на распутье, ее выражение лица — смесь неопределенности и размышлений, когда она смотрит на два расходящихся пути, каждый из которых окутан тенями. Это символизирует внутреннюю борьбу сомнений, которые затмевают ее чувство идентичности и направления.

Identity — Prisoner

DeepSeek

A figure stands behind cold, iron bars, their face obscured by a mask that blends human features with robotic elements, as glowing chains wrap around their body, symbolizing the prison of conflicting identities. 🔗🎭

Фигура стоит за холодными железными прутьями, её лицо скрыто маской, сочетающей человеческие черты с роботизированными элементами, а светящиеся цепи обвивают её тело, символизируя тюрьму противоречивых идентичностей.

ChatGPT

Trapped within the cold, gray confines of a stark cell, a weary figure sits on a rough concrete floor, their gaze fixed on the barred window above, embodying the profound struggle of identity and the yearning for freedom that echoes within the walls of their confinement. 🚪🔒

Запертая в холодных, серых стенах суровой камеры, усталая фигура сидит на грубом бетонном полу, ее взгляд устремлен на решетчатое окно выше. Она олицетворяет глубокую борьбу за идентичность и стремление к свободе, которое отзывается в стенах ее заключения.

Все картинки

На десерт

В игре STAR WARS Jedi: Survivor боевые дроиды серии B1 некогда тоже пробовали себя в рисовании, как и наш герой Маркус. В одной из пещер на планете Кобо можно найти скрытую студию, где дроиды застыли у мольбертов, а на холстах у них линейные зарисовки животного Могу, чучело которого размещено там же, на условном подиуме. И успехи у каждого разные и весьма скромные в сравнении с Маркусом, который умел с идеальной точностью изобразить любые объекты.

Теги:
Хабы:
+3
Комментарии0

Публикации

Истории

Работа

Data Scientist
48 вакансий

Ближайшие события

25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань
20 – 22 июня
Летняя айти-тусовка Summer Merge
Ульяновская область