Нейросети - восхитительно мощный, полезный, эффективный инструмент. Но все ли любят их так, как любим их мы, разработчики? Пытаясь продвигать идеалы нейросетевой разработки при создании небольшого ретро-шутера, мы неожиданно наткнулись на шквал ненависти в наш адрес со стороны простых игроков. Как мы используем нейросети в геймдеве? Справедливы ли обвинения в воровстве? И за что ненавидят «художников новой волны»?


Про какой проект речь?

С лета 2022 года мы разрабатываем старомодный шутер про демоническое вторжение и противостоящего ему харизматичного героя а-ля Дюк Нюкем. Проект создаётся в качестве хобби силами небольшой команды профессионалов-энтузиастов. Пиарить сам проект не буду, это против правил Хабра, но если кому интересно, то запросите ссылку в комментариях :)

Такое вот выражение любви к классике в лице Half-Life, Quake 2, Doom, SiN.

Как единственный выживший после неудачного портального эксперимента, наш герой пробивается в поисках своей жены сквозь медленно проваливающуюся в ад военную базу, попутно отстреливая из верного дробовика полчища нежити, демонов и мутантов. Классический сюжет для ретро-шутера, хоть и с парой интересных твистов посередине. Основную ставку, как полагается в шутерах старой формации, мы всё-таки делаем на геймплей и дизайн.

Статья не про то, но не могу не похвастаться, какие крутые у нас выходят монстры :)
Его зовут Бластермен - и наука до сих пор не определилась с вопросом "а куда он кушает"

В основе художественного видения проекта – концепция «игра из 2005-го, сделанная сейчас». Но то, что мы делаем игру в том виде, в каком она могла бы существовать в прежние благословенные годы – не значит, что мы должны пользоваться сугубо инструментами из 2005-го. Конечно, кое-где мы намертво привязаны к технологиям и утилитам выбранного движка родом из той эпохи… но там, где мы можем – мы применяем всё самое свежее и эффективное.

Лирическое отступление про движок

Мы добиваемся аутентичности нашего «ретро», используя игровой движок BIMA – по сути, движок 15-летней давности, дальнего потомка легендарного (в основном в плохом ключе) FPS Creator. Кто-то скажет, что это уже чересчур – но мы, тем не менее, явно видим результат такого подхода, когда от игроков получаем отзыв вида «не можем сказать почему, но мы видим, что это не Unity/Unreal». Про причины выбора я уже писал тут.

Несмотря на множество косметических «подтяжек» (PBR, шейдеры, физика) – наш движок всё ещё остаётся технологией родом из 2005-го на базе DirectX 9, с соответствующими техническими ограничениями. Так, для моделей персонажей мы ограничены бюджетом в 10-15к полигонов, присутствует лимит на число активных предметов, на геометрию уровней, ряд ограничений в работе подсистемы освещения... Если будет интересно – выпустим отдельную статью про особенности разработки на ретро-движке.

Все уже люди взрослые, преимущественно за 30, трезво оцениваем свои силы, и поскольку бюджета у нас нет (хобби-разработка - она такая), то любой инструмент, который может помочь – на вес золота.


Генерация класса «крутите барабан»

Мы используем нейросети повсеместно, «затыкая» ими дыры на месте отсутствующих или слишком занятых специалистов. Они помогают нам, генерируя арт, концепты, текстуры, озвучку (уточнение – см. послесловие в конце статьи).  

Как у нас, скажем, появляется новый монстр? Вот с точки зрения игровых механик возникла задача – «нам нужен ещё один вид противников, который делает то-то и то-то». Тогда мы проводим мозговой штурм, на котором мы набрасываем мысли: что это за создание может быть такое, как выглядеть, откуда взяться, как будет вписываться в игровой мир?

Если на этом этапе цельное видение монстра не сложилось – именно тут в дело вступает Stable Diffusion, причём с самым примитивным сценарием использования: из характерных черт желаемого существа составляем промт, добавляем модификаторов по вкусу, забрасываем в бедную нейросеть. «У неё голова железная – пускай соберёт чего-нибудь из этой солянки».

Неопытный промт-инженер загружает в нейросеть описание вида «сделай монстра, страшного, зубастого, высокая оригинальность, HDR, 4K, Artstation»

Зачастую результат оказывается убогим – кривым, косым, шаблонным. Но в этой куче мусора мелькают и крупинки золота – по-настоящему интересных идей. Порой нейросеть, подобно сну человеческого разума, порождает интересные и очень необычные образы чудовищ.

Жертва результат генерации промта «Zombie in power armor by WLOP, Neon, Electric Colors, Cinematic Lighting, Studio Lighting, Ray Tracing Reflections». Если не смотреть на автомат –достаточно прилично.

Именно так, например, оформился наш «заглавный» монстр, долгое время красовавшийся на обложке игры – одержимый морпех. Мы пытались придумать запоминающуюся разновидность зомби-охранника, закидывая нейросеть промтами разного уровня бредовости методично перебирая варианты. Одна из генераций неожиданно подарила нам изображение живого мертвеца с горящими внутренним светом окулярами маски-респиратора. Монстр оказался и нестандартным, и на удивление харизматичным. И совсем не похожим на заглавного монстра из Resistance, да!

Так выглядит результат – сверху монстр рядом со всё ещё «здоровым» товарищем, снизу – в процессе нападения на игрока из засады.

Довольно быстро была создана модель персонажа, и его жёлтые окуляры удачно вписались как в лор (проявление силы демона, вытеснившего из тела бывшего владельца), так и в механику игры (по горящим в темноте глазам очень удобно целиться). Успех!


А теперь давайте серьёзно

То, что мы описали выше – достаточно сомнительный метод. Подход «засыпать детали в мешок и трясти, пока не соберётся радиоприёмник» редко приводит к желаемому результату. Потому за созданием наших артов сейчас стоит более серьёзный подход.

Неопытный промт-инженер изучает результат генерации

Вот пример: нам потребовалось придумать, как могла бы выглядеть жена главного героя – видный учёный и руководитель портального эксперимента – попав под развращающее демоническое влияние. Для метода «засыпать и потрясти» мы сформировали промт вида «beautiful and slender female demon in fantastic high tech combat armor casting a spell in front of teleportation chamber, by WLOP, Neon, Electric Colors, Cinematic Lighting, Ray Tracing Reflections», по которому и получили неказистое, но любопытное изображение.

Светящаяся грудь?! SD, а ты, оказывается, проказник! А если серьёзно – куча ошибок генерации. Анатомия вообще вышла из чата. Но идея уже вырисовывается.

В качестве стартовой точки – довольно неплохо. Можно было бы попытаться вытянуть картинку, перерисовав «больные места» при помощи inpainting… Но здесь не всё хорошо. Например, броня больше напоминает средневековую – и это не поправишь так запросто. Мы приступили к сложному и творческому процессу.

За помощь с промт-инжинирингом и генерацией отдельное спасибо программисту, писателю и просто хорошему другу Сергею Бельскому.

Итерации процесса и финальный результат (внимание, много картинок!)

1) Пробуем поправить дело, подключив LoRA, ориентированную на рисование женских образов. Анатомия теперь больше похоже на человека, дефекты ушли, да и вообще прорисовка деталей стала лучше. Проблема другая – из фурии наша злодейка превратилась в гурию. Не годится.

2) Добавили в промт немного особенностей, взятых из бэкстори героини, сменили LoRA. Вышла… Капитан Марвел с кошачьими ушами? У Сергея, доброй души, все выходящие из-под его пера злодейки оказываются крайне милы и располагающи. Нам же нужны злоба и безумие.

3) Добавили в промт черты героини, подумав, на кого из популярных персонажей её сделать похожей. В качестве референса – Сильвана из ВоВ. Симпатичная, опасная, недобрая. Интересные варианты брони, но первая леди – скорее ассасин, вторая – невыспавшийся косплеер.

4) Перебираем определения мрачности. Уже ближе, гораздо ближе, героиня смотрит угрожающе – но вид у злодейки всё ещё слишком человечный, не хватает по-настоящему злобной, демонической жилки.

5) Ищем новые референсы. Знает ли нейросеть Кэрриган? Результат получился вот такой – инопланетная королева, которая явно ждала нас на чай с плюшками. Слишком добрая!

6) Варьируем промт. Мы явно на верном пути – костюм заострился, уже страшнее, хотя инсектоидных мотивов теперь многовато. И какая-то вотермарка в углу.

7) Добавлено больше злодейства. Рыжие огоньки в глазах, злобная гримаса, любопытный костюм. На этом можно было бы уже остановиться…

8) Но мы слегка варьируем промт, пробуем перебирать LoRA, и… вот оно, стопроцентное попадание! Футуристический костюм, острые черты симпатичного, в сущности, лица, нездоровая бледность, демонический огонь в глазах, сумасшедшая улыбка. Лучшего нечего и желать!

Результат после незначительного постпроцессинга (inpainting ошибок и добавление блума, улучшение лица ещё одной нейронкой и upscale)

Как видите, процесс разработки персонажа, даже с использованием нейросетей - длительный, интенсивный и целенаправленный.


Ненависть и обвинения

Мы решили поделиться результатами на Реддит – крупнейшей англоязычной площадке, куда инди-разработчики со всего мира ходят и других посмотреть, и себя показать. Мы сделали скромный пост – и нас тут же захлестнула волна самых неожиданных на тот обвинений.

Типовые примеры недовольных комментариев

Поведаю об основных обвинениях, поступающих в адрес «AI-художников»:

Ваш результат – не результат, ведь вы не сами рисовали. Да и вообще взять нейросетку и нарисовать такое каждый может!

Мне было удивительно узнать, что до сих пор встречаются люди, которые «мерилом работы считают усталость». То есть если процесс переноса галлюцинаций заказчика на цифровой носитель выполнен человеческой рукой – то это настоящее искусство, а если красивую картинку создала нейросеть – результат автоматически становится посредственным и невпечатляющим?

Тут я затрудняюсь ответить. Вероятно, роль играет тот факт, что раз мы можем «конвейерным методом» выдавать таких творений по сотне в час, то в нашей культуре изделие автоматически считается «бездушным», поделием масс-маркета. Но если это была штучная работа (не важно, картина это или, скажем, табурет), над которой вручную потел и ругался живой творец, то предмет автоматически приобретает значимость.

Вспоминается классика

Лукьяненко: «Что может быть нелепее профессии грузчика в виртуальном мире? Нет, вы скажите, что может быть более не нужно в мире электронных импульсов, где нет на самом-то деле ни расстояний, ни тяжестей? Весь фокус – в подсознании. Если рояль доставят в виде резиновой игрушки и надуют посреди комнаты – ты не поверишь в его чистое и настоящее звучание. Надо, чтобы на твоих глазах крепкие ребята в спецовках тащили, чертыхаясь и обливаясь потом, груз по лестнице…».

Причём художественная ценность штучной работы подчас отходит на второй план – важным в глазах зрителя становится «культурный шлейф» объекта творчества, составленный из авторского видения и предыстории создания. И вот у нейросетей с «культурным шлейфом» пока в глазах вашей аудитории всё очень сложно.

Эталон произведения, намеренно наделённого нулевой художественной ценностью, но зато с огромным «культурным шлейфом»

Нечто подобное я застал во времена своего детства, когда плёночные фотокамеры сражались с цифровыми. Последние обвиняли в «бездушности», а сделанные ими снимки считались безвкусицей и «холодной цифрой». Старые фотографы ворчали – без ограничения в 32 снимка нет необходимости тщательно выбирать ракурс, ловить кадр, строить сцену… Знай ходи да щёлкай затвором как дурак, авось чего получится! Да ещё и половину параметров тебе автоматика подберёт, вообще срамота!

Прошло два десятка лет – и где они, плёночные камеры? Ушли в историю, оставшись на полках в качестве развлечения для элитариев. А вот цифровые процветают – встроены в каждый смартфон.

Вполне возможно, что мы являемся свидетелями такого же перехода в мире цифрового арта. Так или иначе, но пока что созданные ИИ изображения частью вашей аудитории оцениваются как низкопробные поделки, где всё вместо компьютера сделал человек. Звучат скандалы вида «мы поймали художника на том, что он пользовался нейросетями, он заклеймлён позором, его результаты выброшены в помойку».

Арт не без недостатков – но это халтурное отношение художника, а не проблемы нейросети.

Это кража, ведь нейросеть учится у художников!

Обвинение частое и для западной аудитории, уважающей копирайты, довольно болезненное. Ведь нейросеть и правда использует для обучения работы настоящих художников, а значит, создаёт в некоторой степени производные от них творений (причём без согласия самих авторов)? А когда нейросеть начинает копировать стиль известного своей техникой художника, грозя оставить того без куска хлеба – то всё становится совсем грустно.

Немного об аргументации обеих сторон конфликта уже было на Хабре

Проблема на самом деле весьма сложна. Почему, когда чужие приёмы и стиль использует живой человек, то это называется «учился и вдохновлялся»? Ведь «мясные» творцы также имеют в своей голове нейросеть, которая подобным же образом учится на работах лучших из мастеров. Ещё древние греки сказали, что мире в принципе нет ничего нового – и всякий человек учится у предшественников, рекомбинирует существующие чужие идеи через призму своего опыта. Чем же хуже нейросеть?

Впрочем, давайте оставим эти вопросы философам и юристам. Интересно то, что сам факт использования столь полезного инструмента сделает из вас работ в глазах части аудитории воришку чужой интеллектуальной собственности. Это крайне неприятно и, на мой взгляд, незаслуженно. Такая проблема со временем разрешиться, когда отношение общества к ИИ станет яснее – но уже сейчас надо это учитывать и быть готовым к работе с возражениями.

Дополнение: пока писалась эта статья, открылись новые обстоятельства. См. послесловие в конце.

Это отнимает рабочие места у художников!

Довольно популярная позиция – используя нейросеть, мы лишили рабочего места художника, которого бы иначе наняли на эту работу. Позиция особенно близка для заокеанских стран, где сильна традиция профсоюзных трудовых квот из серии «чтобы иметь право снимать свой фильм, вы должны нанять 25 членов профсоюза актёров, даже если это документалка о животных».

В геймдеве тоже есть свои профсоюзы, пусть и не настолько сильные. Источник

В условиях же суровой реальности, если бы не нейросеть, то никакого художника мы бы не наняли, а рисовали те же арты с меньшими успехами и получали бы на выходе худшее качество.

Впрочем, опасения понятны. История знает множество таких моментов, когда механизация труда сделала ненужным специалистов труда ручного. Только вот многие не учитывают, что потом за новые машины стали дети тех же работников, а суммарная производительность многократно выросла. Так и тут, настоящие художники не вымрут – просто изменят свой инструментарий на более эффективный. Уже сейчас многие в восторге от «Генеративной заливки» в последних версиях Photoshop.

Впрочем, до осознания этого «ИИ-артисты» ожидаемо получат тонну негатива на свою голову.


Перспективы и советы

Людей, ненавидящих нейросети, не так уж мало. Они впечатлены силой науки, давшей нам возможность за одно нажатие кнопки сотворить шедевр. Они напуганы и не понимают, как это работает – и не понимают, как это повлияет на их жизнь. Стоит ли их дразнить ипровоцировать? Или лучше скрывать тот факт, что вы используете нейросети в своей работе?

Думаю, на нынешнем этапе дразнить аудиторию неразумно. Не все ещё готовы принять, что джинн уже выпущен из бутылки. Но скоро всё изменится. Помимо громких публикаций о том, что кто-то смог полностью автоматизировать свою работу – уже сейчас есть люди, которые втихомолку используют нейросеть, чтобы получить многократный прирост производительности. Новая эра на пороге, к добру или к худу. И даже если мы с вами уже готовы к ней – то надо пощадить чувства тех, кто ненавидит нейросети.


Послесловие

На днях начали появляться первые весточки пугающих перемен. Торговая площадка Steam начала закручивать гайки в отношении проектов, использующих творчество ИИ-артистов. Их аргументация понятна – пока нет законов, описывающих правила обучения нейросетей. Соответственно, создавая производные от чужих работ, можно нечаянно нарушить чужие права на интеллектуальную собственность. Потому сейчас наблюдается волна разбирательств с теми, кто основывал всю разработку на ИИ-пайплайне – и непонятно, в какую сторону качнётся этот маятник дальше.

Соответственно, мы сейчас занимаемся тем, что обеспечиваем лицензионную чистоту нашего проекта, в том числе – отказом от использования подозрительных нейросетевых моделей.

Всё-таки не могу не похвастаться ещё одним крутым монстром :)
Новая обложка игры с монстром авторства Владимира Бузова. Стопроцентно натуральная ручная работа, никаких нейросетей!

Впервые опубликовано в журнале "Рендер.ру", август 2023, #13.