myops 16 авг 2024 в 13:11

Что не так с ИИ-картинками

25 мин

23K

Блог компании Альфа-БанкДизайнИскусственный интеллект

Мнение

«Китайский мудрец, сидя на берегу реки, сетует на расплодившиеся вокруг технологии», — такой текст я вбила в какую-то из многочисленных нейросетей, генерирующих картинки. Судя по всему, вместо расплодившихся вокруг технологий китайский мудрец случайно получил расплодившиеся ноги.

ИИ, с ним такое бывает.

Заметили, как много появилось сгенерированных ИИ картинок? Они везде: в рекламе, в соцсетях, на аватарках в телеграме, в новостных изданиях, в книжных иллюстрациях. В статьях на Хабре, в конце концов.

Теперь (лично моим) любимым занятием стали попытки понять, сделано ли изображение ИИ или создано человеком. Нейронки поначалу казались только очередной забавной игрушкой, которую люди успешно забудут, наигравшись вволю. Но всё случилось ровно наоборот — теперь их воспринимают слишком серьёзно, как реального конкурента человеку.

Так ли хороши сгенерированные изображения, чтобы полностью заменить человека на поприще визуальных искусств? Или это всё-таки успешный маркетинг вкупе с нашей верой в технологии необоснованно заставил нас поверить во всемогущество генеративного ИИ?

Дисклеймер! Я не выступаю против использования ИИ. Он, несмотря на все свои минусы, всё ещё является мощным инструментом для художников и дизайнеров, потенциал которого только предстоит раскрыть. Но именно как инструмент, а не самостоятельный автор. Мне кажется важным посмотреть на ИИ с критической точки зрения, а не слепо восторгаться ему или точно так же слепо его ругать.

Любовь к ИИскусству

Если вдруг утверждение о том, что ИИ-изображения можно найти повсюду, вам показалось голословным преувеличением, держите несколько распиаренных примеров.

Вот, например, реклама Coca Cola, использованная, чтобы объявить о начале сотрудничества компании с OpenAI и запуске конкурса «Create Real Magic» («Создай настоящую магию»). По условиям конкурса участники должны были создать «произведения искусства», скомбинировав винтажную рекламу Колы и использование нейронок. И здесь как будто бы и кривые буквы, и проблемы с пальцами у астронавта не должны вызывать вопросов — ИИ же рекламируют, чего пристали.

Еще один пример, но намного скромнее: реклама какого-то шампуня для мужчин постарше. Здесь даже придраться сложно: мужчина как живой, с вполне человеческим выражением лица, да и пальцев, к счастью, не видно. Да, немного замыленный, как будто переборщили с фотошопом, и волосы как-то странно лежат. Но если не вглядываться, то эффект зловещей долины даже не чувствуется.

Мой личный фаворит в этой подборке — рекламные изображения для продвижения книги, созданной при помощи ИИ.

Если картинка кажется вам вполне естественной, приглядитесь к деревьям, дому на заднем плане, флагу и трубе рядом с ним

Немного покопавшись на Реддите, можно найти информацию, что эти ИИ-картинки выкладывала у себя на сайте французская школа Gobelins. Это известное учебное заведение, которое готовит специалистов по визуальным искусствам, включая дизайн и анимацию. Однако даже поверхностный ресерч доказывает, что это был отдельный сайт студентов Gobelins. Но тем не менее официальный аккаунт школы продвигал книгу, поддерживая тем самым такого рода использование ИИ.

Использование ИИ зашло так далеко, что теперь люди говорят о появлении новой профессии — «ИИ-художник», а те, в свою очередь уже даже дают интервью. Их работа отличается от труда обычного художника и, на самом деле, не особо сложна: напиши промпт, а потом обработай результат в фотошопе или обрисуй так, чтобы результат меньше походил на работу ИИ.

Не находите в этом никакого противоречия?

Вроде с гордостью продвигают технологии, но в то же время стараются их скрыть. А тут внезапно обнаруживается, что открытое признание в генерации контента людям не нравится.

Изображение выше — один из немногочисленных примеров удачного использования ИИ. Почти ничего в нём не выдаёт нейронку, кроме отдельных мелких деталей, которые вы, скорее всего, даже и не заметили. Иллюзия разрушается не в вакууме, а в контексте: почти все работы ИИ-художников выглядят если не практически идентично, то ужасно похоже одна на другую. Как NFT с обезьянами, к счастью, давно забытыми.

Но это всё там, далеко, а у нас что? Практически то же самое, только стеснения чуть больше. В начале этого года у АСТ вышел (любители школьной программы по литературе, пристегнитесь) графический роман по «Евгению Онегину». Звучит даже неплохо — зумерам же тоже нужно приобщаться к классике. Но есть нюанс. Все изображения в издании сгенерированы нейросетью, и результат, мягко говоря, далековат от удачных примеров.

Удивительное разнообразие — на 6 изображениях из 8 главный герой стоит одним и тем же ракурсом спиной к зрителю

Книгу и сейчас можно найти на маркетплейсах с разбросом в ценнике от 600 до 1500 рублей — такова цена труда нейросети на российском рынке. Судя по отзывам на сайте Лабиринта, большинству людей скорее нравится политика издательства в использовании ИИ. Портит красивую картинку только общий рейтинг в 3.65 звёзд из 10 и недвусмысленный намёк от Лабиринта на модерацию рецензий.

Несмотря на неоднозначное отношение многих людей к использованию генеративного ИИ, компании, бренды и издательства продолжают цепляться за него, как за спасательную соломинку. Допустим, чтобы понять, чем они руководствуются, много ума не надо. Но что движет защитниками ИИ (каких тоже немало) считать, что ИИ уже топчется по пятам дизайнеров и иллюстраторов, с нетерпением дожидаясь, когда же он уже заменит людей?

«ИИ-искусство — это искусство»

Эту фразу я беру не с потолка — люди пишут про это целые статьи. Однако, если признаться честно, мне никогда не попадались материалы, в котором чётко и не поверхностно были бы аргументированы основные преимущества использования генеративного ИИ. Максимум — однотипные и скучные «эссе» с минимальным уровнем осмысления написанного (подозреваю, их клепает такой же ИИ или очень уставшие смм-щики на фрилансе).

Понять, как однотипно и по-школьному написаны все эти тексты, можно, владея английским даже на начальном уровне:

Источники: Embracing Creativity: How AI Can Enhance the Creative Process и Increase Your Creativity with Artificial Intelligence

Да, здесь только два текста взяты из статей, остальные два я попросила сгенерировать у нейронки. Ну, вы поняли, найдите 10 отличий. Все они написаны с одними и теми же аргументами: ИИ создает идеи, картинки, музыку, тексты, идеи, картинки, музыку, тексты.

В том же ряду пресные интервью представителей компаний, занимающихся развитием ИИ, но о них позже. И ещё есть отдельные посты и реплаи в соцсетях под многокилометровыми срачами.

Если всё суммировать и выразить ясно, то у защитников генеративного ИИ основные тезисы сводятся к следующему:

Принципы работы человека и ИИ практически идентичны. Обучение машины на изображениях и генерация на основе них новых, в целом, соответствует человеческому опыту. Поэтому, обвинения в том, что ИИ может что-то «воровать», несостоятельны: человек же тоже на чём-то учится.
Создание контента генеративным ИИ является таким же актом творчества, как и создание его человеком. Генеративный ИИ выступает лишь инструментом в выражении человеческой креативности.

Я не зря выделила в последнем пункте слово «инструмент», потому что мы используем его в разных смыслах. Для апологетов ИИ нынешние нейронки, которые генерируют изображения по текстовому запросу человека, выступают чем-то вроде кисточек, красок или фотошопа. В то же время я имею в виду, что ИИ хорош в качестве самостоятельного создателя, практически полностью отвечающего за весь творческий процесс.

В своём нынешнем виде ИИ спихивает на человека всю самую монотонную и нудную часть работы, заставляя его отбирать удачные варианты и править их до удобоваримого состояния. Хотя всё вроде как должно было быть наоборот (по крайней мере, нам так обещали и обещают).

Пятилетка обещаний избавить от однообразной работы.

Здесь я вступаю на зыбкую почву: понятия и границы слишком размыты, а сфера творчества слишком субъективна, чтобы выносить какие-либо категоричные суждения. Тем не менее, в этом разделе я попытаюсь подробнее разобрать аргументы защитников ИИ и показать, что с ними не так.

Первая часть: про творческий процесс

Как я понимаю (достаточно упрощённо), все нейронки, создающие изображения, являются диффузионными моделями. Не углубляясь в детали физических принципов и математических формул, благодаря которым эти модели способны работать, можно схематично объяснить работу моделей следующим образом:

Модель искажает (зашумляет) обучающие данные до состояния чистого шума, из которого потом обратно собирает четкое изображение.
Изображение генерируется исходя из текстового описания (промпта), которое модель разбивает на ключевые слова и фразы (токены).
Из имеющейся выборки модель подбирает изображения, наиболее похожие по описанию на текст, а затем «собирает» заново картинку, также похожую на него.

Нетрудно догадаться, что из среднего значения модель в итоге создает тоже что-то среднее.

Итак, называть искусственный интеллект интеллектом на данном этапе своего развития будет преувеличением. Хотя когнитивисты, биологи и прочие умные дяди и тёти сейчас более-менее понимают, как устроены и работают наше сознание и мозг в целом, повторить всё то же самое с машинами пока не получается. Примеры обратного я не нашла, но, если у вас они есть (с ссылками на авторитетные источники), буду рада увидеть их в комментариях.

А если и получится провернуть такое с машинами, то совсем не скоро.

Потому что пока все генеративные модели, неважно, работают они с текстами или с изображением, выглядят как эксперимент с китайской комнатой в реальной жизни. Да, тема с этой комнатой — почти что ровесница динозаврам (аж с 80-х годов спорят), но до этого дня не появилось никакой теории или аргумента, которые смогли бы её опровергнуть.

И ИИ сейчас, словно Джон Сёрл, который сидит в своей закрытой комнате и без знания китайского языка старается из иероглифов собрать осмысленный ответ, также пытается выдать имитацию осмысленности на человеческий запрос. Получается иногда неплохо, но до пресловутой осмысленности далеко.

Вот перечень некоторых преимуществ человеческого интеллекта над искусственным, взятый из книги французского нейробиолога Станисла Деана «Как мы учимся. Почему мозг учится лучше, чем любая машина… пока»:

Про автора

Если кого-то (небезосновательно) смущают цитаты из научпопа, скажу только, что у нашего эксперта более 900 научных публикаций и весьма приличный индекс цитирования.

Усвоение абстрактных понятий. Даже самые продвинутые модели глубокого обучения пока что способны схватывать и понимать только поверхностные закономерности (или делают это плохо). В то же время любой человек, если у него нет серьёзных когнитивных нарушений, способен выстраивать абстрактную модель мира. Это та причина, по которой ИИ на основе диффузионных моделей, например, не может генерировать буквы и шрифты или делает это с трудом: у него просто нет абстрактного представления о том, как они должны выглядеть.

Большинство статей по этой теме — это теоретизирование и проведение мысленных экспериментов. Пока что консенсус в академической среде сводится к тому, что у ИИ (в самом широком смысле, не только у генеративных моделей) есть проблемы с абстрактным мышлением. Вот несколько статей по теме, в которых как раз говорится об отсутствии абстрактного мышления у моделей:

Систематичность и язык мышления. Логичное следствие предыдущего пункта: не умея усваивать абстрактные правила, модели искусственного интеллекта не могут создавать и свои. Простейший пример из книги, объясняющий, чем отличается мозг человека от мозга приматов и искусственного интеллекта:

Услышав последовательность звуков – например, бип-бип-бип-буп, человеческий мозг мгновенно строит теорию относительно лежащей в её основе абстрактной структуры (три идентичных звука плюс один непохожий). Оказавшись в аналогичной ситуации, обезьяна обнаруживает последовательность из четырех звуков, понимает, что последний отличается, но, похоже, не интегрирует эти фрагментарные знания в единую формулу. <...>
По аналогии с этим потребуются десятки тысяч попыток, прежде чем обезьяна поймет, как изменить порядок последовательности (с АБВГ на ГВБА), хотя четырехлетнему ребенку достаточно пяти. Младенец, который родился всего несколько месяцев назад, уже кодирует внешний мир с помощью абстрактных и систематических правил — это способность, которой напрочь лишены не только классические искусственные нейросети, но и другие виды приматов.

То же самое касается и более сложных правил — грамматических и математических, которые искусственный интеллект создавать не умеет.

Высокая эффективность обработки данных. Все модели вынуждены учиться на огромных датасетах, и на это уходит огромное количество времени. Из меньшего количества информации человек способен усвоить больше и гораздо быстрее. Опять же, выдержка из книги:

По оценкам психолингвиста Эммануэля Дюпу, в большинстве французских семей дети слышат от 500 до 1000 часов речи в год; этого более чем достаточно для усвоения языка Декарта, даже с такими мудреностями, как soixante douze («семьдесят два») или s’il vous plaît («пожалуйста»). <...> Для сравнения: лучшие современные компьютерные системы от Apple, Baidu и Google требуют в 20–1000 раз больше данных, чтобы достичь даже мизерной языковой компетенции.

Компоновка. Это, наверное, самое главное качество человека. Научившись какому-то одному навыку, человек, скорее всего, будет применять его и в других сферах. ИИ, заточенный на выполнение пары отдельных задач, такое пока ещё не умеет. Иными словами, Generative pre-trained transformer (GPTs), которые занимаются генерацией текста, не могут генерировать изображения, как это делают диффузионные модели, потому что в основе их работы лежат разные принципы.

А ещё, как ни странно, из-за этого он не умеет и в креатив: человеку придёт в голову совместить несовместимое (возвращаемся к абстракциям), чтобы в итоге получить нечто новое, а нейросетке — нет.

Кажется, что это как будто не так много, но на деле — огромная пропасть. Генеративному ИИ пока не хватает слишком многого, чтобы наравне конкурировать с человеком в творческой сфере. В конце концов, у него даже и воображения — едва ли не главного элемента любой креативной работы — по сути и нет. Из опыта (а заодно и памяти) у него только несколько сотен тысяч фотографий, но ни о каком чувственном (то есть, полученном посредством органов чувств), эмоциональном, социальном опыте, доступном человеку, речи не идёт.

О теле и творчестве

Мы привыкли недооценивать собственную телесность, даже не понимая, какую на самом деле роль играет наше тело в творчестве. Не углубляясь в тему, расскажу только один попсовый факт: буйство жёлтого цвета в поздних картинах Ван Гога обусловлено не чем иным, как настойкой из наперстянки, которую художник принимал в качестве лекарства. Дигиталис в ней в качестве побочного эффекта вызывает изменение зрения, так что Ван Гог буквально видел мир иначе, чем большинство людей.

Вот и остаётся ИИ разбирать имеющиеся изображения по кусочкам, а потом собирать их заново, ориентируясь на средние параметры.

Будь у него хоть капля фантазии, на мой текстовый запрос о китайском мудреце и технологиях нейронка выдала бы результат поинтереснее, чем то, что вы видите на обложке этой статьи. Может, грустного старичка на фоне ультрасовременного и ультрагрязного китайского мегаполиса. А может, что-то в духе «Чёрного зеркала», где мой несчастный мудрец сидит в бетонной коробке с огромным экраном, по которому течёт несуществующая в физической реальности река… Романтика.

Но нет, теперь вы вынуждены смотреть на то, как средний интеллект выдал что-то тоже среднее. Скучная композиция; балахон, отдаленно напоминающий китайский; здание, отдаленно напоминающее китайское; штука в руках, отдаленно напоминающая телефон. Не картинка, а квинтэссенция среднего.

Да, ИИ (прежде всего, текстовые нейронки) сейчас пытаются научиться составлять фреймы, концептуальные представления о мире, аналогичные человеческим. Идея интересная, пусть с реализацией и проблемы, но, даже если они и научатся, этого всё равно будет мало.

И аргумент про то, что человек тоже учится на чужих работах, совершенно не состоятельный. Процесс нашего обучения кардинально отличается от того, как учат машину. Школьник, списавший по чуть-чуть у всех одноклассников, может совершенно не разбираться в теме, он списал механически и бездумно, но сам решить задачу не в состоянии. ИИ в этом плане ничем от него не отличается.

Немаловажен и факт того, что человек способен учиться на собственном материале, в том числе и на своих ошибках. Студент художественного училища может посмотреть на свои натюрморты, подумать: «Что-то у меня не "дышат" вазы», – и после этого, учитывая свои ошибки, начать работать по-другому и вырабатывать навык. ИИ должен изначально учиться только на хорошем, а при обучении на собственном материале у него каждый последующий результат выходит только хуже.

В творчестве слишком много составляющих, которые ИИ не способен ни уловить, ни сымитировать.

И речь сейчас не идёт о картинах с «глубоким посылом», а вообще о любом творчестве. Человек устроен так, что вкладывает смысл во всё, что делает, даже если это обложка к очередному детективу Дарьи Донцовой. Сможет ли нейросеть сделать что-то такое же наивно-нелепое и смешное, что, к тому же, соотносится и с историей в книге?

Я попробовала задать промпт с тем, что изображено на картинке. Просьба слабонервным, детям, беременным и старикам отойти от экранов — увиденное может шокировать вас. В основном своим уродством.

Женщина ползет по стене при помощи скалолазного оборудования, перед ней лежит запечённая утка и венок, рядом стоит мужчина с букетом роз, позади них идет мужчина с головой волка и несет женщину с головой курицы

Нарисованное человеком выглядит абсурдно и смешно, но в то же время узнаваемо. От сгенерированного изображения, в лучшем случае, вы испытаете легкое недоумение.

Человек достаточно хорошо знает самого себя, чтобы уметь в нужный момент захватить чужое внимание, заставить эмоционально среагировать, откликнуться на нужды ближнего и даже убедить его в чём-то (это сейчас был реверанс в сторону всех дизайнеров, которые умеют делать такие штуки, что у покупателей и шанса не остаётся), но вот машины, увы, нет. Да им это и не нужно — нужно другим людям.

Так может, создатели промптов, обладающие фантазией и способные дать машине релевантное ТЗ, всё-таки занимаются творческой работой?

Вторая часть: творец и его инструмент

Из уст почти всех причастных к разработке генеративного ИИ на резонный вопрос «А зачем он нам вообще нужен?», часто звучат общие клишированные фразы: «ИИ развивает нашу креативность», «ИИ помогает быть креативным всем, а не только узкой прослойке населения» (как будто кто-то запрещал), «ИИ открывает огромное поле возможностей в креативной сфере» и всё такое прочее в том же духе.

Можно ли сказать про тех, кто генерирует изображения при помощи ИИ, что они вовлечены в творческую работу? Ну-у…

Проведу простую и близкую аналогию. Предположим, у нас есть заказчик (неважно, человек это или компания), который хочет получить для собственного или коммерческого использования какое-нибудь изображение. Сам он его сделать не может, потому что не обладает соответствующими навыками. Поэтому он обращается к художнику/дизайнеру, даёт ему ТЗ с подробным описанием того, что он хочет видеть на картинке или, иными словами, идею. Подрядчик выполнил свою работу, принес её на оценку, заказчик внёс свои правки, художник переделал, и вот все довольны результатом.

Так вот, вопрос: имеет ли заказчик отношение к самому творческому процессу?

Вопрос риторический. Да, человек, который пишет промпт, такой же заказчик, который, наверно, имеет ещё более смутное представление о том, каким будет конечный результат. Два года назад мы считали генеративки чем-то «вау», чем-то, что реально может раскрыть горизонт творческих способностей. Но эффект новизны закончился, все привыкли, и никаких выдающихся результатов почему-то нет. ИИ — это «чёрный ящик», но при этом очень предсказуемый, о чём я писала выше. К самому процессу творческой работы человек в случае использования ИИ имеет весьма опосредованное отношение.

В титрах к фильмам и сериалам вы наверняка видели подпись «автор идеи», и она там появляется не просто так. Придумать концепцию, конечно, важно, но это не то же самое, что и воплотить её в жизнь. При этом я намеренно упрощаю: во время работы автор идеи может корректировать процесс, да и к заказчику художник принесёт не готовую картинку, а сначала только эскиз. Но при использовании ИИ автору промпта даже это недоступно.

Подчеркну, ИИ можно и нужно использовать как инструмент, помогающий в основной работе, а не делающий её целиком. Например, сегментированно обрабатывать отдельные поверхности в анимациях, не занимаясь нудной работой вручную.

Вот здесь, например, можно при помощи ИИ обработать поверхность линз и зубов (в X) — Вот здесь, например, можно при помощи ИИ обработать поверхность линз и зубов (@JamesLee03в X)

90% изображений, полностью созданных нейросетями отличаются невысоким качеством, хотя есть и те очень немногие примеры удачного использования ИИ. Их не отличить от человеческой работы, но ценности в них мало. Красивая картинка делается при помощи постобработки и качественно подобранных «референсов» — хороших изображений, которые нейросеть сплющит, а потом выдаст на их основе что-то среднее.

К слову, о материале для генеративного ИИ.

Юридические тонкости

Откуда для моделей берутся изображения, на которых они будут обучаться? Пользуясь старой народной мудростью «всё, что лежит в открытом доступе — и моё тоже», компании по типу OpenAI, Midjourney и прочие ребята активно прибегали к этой практике и брали всё, что не было скрыто пэйволлом (и то, что скрыто, тоже брали).

Просили ли они предварительное согласие тех, чьи работы они использовали? Платят ли они тем, чьи работы они «экспроприировали»? Ответ везде отрицательный (об этом речь пойдёт далее).

Выходит, что к тому моменту, когда первые версии моделей выкатили в свет, они уже успели «съесть» терабайты изображений, на использование которых никто никакого разрешения не давал. В целом, физической возможности дать разрешение и не было.

Когда мы скачиваем приложение или регистрируемся в соцсетях, мы даём разрешение на обработку наших данных. Однако в случае с нейросетями складывается полностью обратная ситуация: пока ты не дал своего отказа на использование твоих работ нейросетями, их будут использовать для тренировки ИИ.

Какая удобная ситуация для компаний, правда?

Корпорация может делать то, что захочет, пользуясь лазейками в законодательстве. А отдельно взятый человек должен, например, добавлять кусок кода на сайт со своими работами, чтобы какой-нибудь OpenAI перестал тянуть туда свои руки, или заполнять форму (!) с отказом отдавать свои работы для тренировки ИИ. Как будто мы в анекдот попали — напиши отказ, что ты не согласен, что тебя будут каждый день бить дубинкой по голове.

Но, даже если внезапно все художники подпишут такой отказ, это мало на что повлияет: их работы уже находятся в датасете предыдущих версий моделей, а новые могут обучаться на таком же искусственно сгенерированном контенте. Непонятно, будет ли модель из-за этого терять в качестве (учатся-то она на плохом), но в этом направлении уже работают и OpenAI, и Google, и Anthropic. Результаты, правда, пока так себе — вот ещё одна из последних статей по теме, которая наглядно демонстрирует, к чему приводит обучение ИИ на собственном контенте.

Помните огромный скандал с Цукербергом и слитыми конфиденциальными данными пользователей Фэйсбука? Результат творческой работы не попадает под понятие «конфиденциальные данные». Зато берут их далеко не в целях личного пользования, а с вполне коммерческими намерениями: создание сгенерированных картинок вполне может считаться хорошим и прибыльным бизнесом для ИИ-компаний.

Не все согласны с такой ситуацией. На OpenAI уже активно подают в суд: это и коллективные иски, и индивидуальные.

Первыми были писатели. В 2023 году The Atlantic рассказал, что при тренировке ChatGPT было использовано более 170 000 книг.
В суд на OpenAI подали Гильдия авторов, The New York Times и ряд отдельных писателей. Разбирательства продолжаются до сих пор, отдельные иски суд уже отклонил под предлогом того, что он не может найти «существенные следы заимствования».
Художники тоже создают иски против компаний: в мае этого года в суд против Midjoruney подали 10 художников, но никакого решения по этому делу пока что нет.

Пока что суд за неимением прецедентов и каких-либо разработанных законов в этой сфере ориентируется на законодательство в отрасли интеллектуального права, которое изначально создавалось для тех случаев, когда человек ворует у другого человека. Оно само по себе несовершенно: грани между подражанием и простым вдохновением размыты. Суд, в свою очередь, вынужден ориентироваться на что-то конкретное.

Однако это всё не работает в сторону ИИ просто потому, что он не человек и работает не так же.

Это с человеком непонятно, своровал он или ему просто пришла в голову такая же мысль. А в модель сначала были загружены изображения, а та их расщепила и потом сжала в нечто. Есть только факт — ИИ-компании изначально брали их без разрешения на использование. Но пока бюрократическая машина разберётся в таких тонких материях, последствия для работников креативной индустрии будут необратимыми.

И давайте здесь окончательно закрепим два тейка:

Аргумент, что «человек тоже учится на чьих-то работах» несостоятелен, потому что генеративный ИИ устроен не по тому же принципу, что наш мозг: мы изначально сравниваем мало сравниваемое.
Человек и за обучение тоже часто платит: за учебники, курсы, посещение специальных учебных заведений (не всегда из своего кармана, но всё ещё платит). Самоучки тоже есть, не спорю, но даже у них большую роль играет фактор социального научения — банально фидбэк от опытных людей тоже к нему относится. Да и пиратство в большинстве стран всё-таки хотя бы формально запрещено.

Потенциальные юридические и не только проблемы светят не только компаниям по типу OpenAI, но и тем, кто решил, что заменить всех дизайнеров в штате ИИ — это отличная идея. Никаких громких прецедентов пока не было, но всегда можно представить что-то самому: гипотетическое и гиперболизированное.

Предположим, у нас есть издатель, который хочет проиллюстрировать художественную книжку.
Он подбирает художников, чей стиль может потенциально подойти книге.
Платить наш издатель не хочет, поэтому просит ИИ нарисовать иллюстрации, похожие по стилю на художника (к тому моменту, допустим, нейросети научатся делать что-то достаточно похожее и при этом не уродливое).
Суд, может, и не защищает авторский стиль, который скопировал ИИ, но на издателя художник всё равно может подать в суд.

Ладно ещё подаст, но он же может и бучу поднять: посмотрите, мои работы украл ИИ! Удар по репутации, незапланированные издержки, прибыль, ниже ожидаемой. Все ли компании готовы тратить свои ресурсы на такое?

Не все.

Некоторые уже публично отказываются от использования генеративного ИИ. Например, рекламное агентство BBDO не будет прибегать к созданию контента при помощи ИИ. Оно будет использовать ИИ только чтобы делать прогнозы для рекламных кампаний. Некоторые более осторожны в заявлениях: Nintendo, мол, не то, чтобы против генеративного ИИ, но заменять им людей не хочет и вообще понимает все проблемы, связанные с интеллектуальным правом.

Труднее с теми, кто пишет промпт.

Те немногие примеры удачных картинок ИИ, которые я показывала выше, вполне себе продаются. Только отдельные авторы не так заметны, как крупные конгломераты, специально их искать никто не станет и подавать в суд тоже. Другое дело, если они станут известны широкой публике, для чего я, на самом деле, не вижу пока никаких оснований.

Все эти люди, помимо клепания картинок в Midjourney, в основном занимаются продажей крипты, NFT и прочих нишевых вещей, которые интересны крайне узкому кругу людей. Почему эти темы всегда идут рядом? Об этом позже.

Коллективные и индивидуальные иски — не единственный способ бороться с компаниями за оплату своего труда. В конце 2023 года забастовка Гильдии актёров в Америке завершилась в том числе и соглашением по поводу использования генеративного ИИ: использовать цифровую копию с актёра студия, во-первых, только с его согласия, а во-вторых, отчисляя за это выплаты.

Вот только по каким-то причинам дизайнеры под ручку с художниками не побежали массово в суд, объединившись против ИИ, как это сделали другие креативщики. И на то есть ряд особых причин.

Страх и ненависть на рынке креативных специальностей

Комьюнити дизайнеров и художников, пожалуй, находятся в самом уязвимом положении в сравнении с остальными творческими профессиями во всей этой ситуации с использованием нейронок. Если в случае со всеми пишущими есть какой-никакой консенсус, что ИИ не способен (по крайней мере, пока) выдать ничего путного на уровне человека, а в ситуации с актерами уже есть кейс с выплатами людям за использование их сгенерированного изображения, то ничего такого сказать нельзя о художниках.

Возможно, виной тому наше общее культурное представление о том, как должна выглядеть работа художника и нужно ли за неё платить.

Начиная примерно с периода Ренессанса стало распространяться романтическое (вредительское, честно говоря) убеждение в том, что творчество — естественное стремление художника выразить самого себя, независимо от того, платят ему за это или нет. Хотя оно уже тогда не соответствовало действительности: красивая картинка современной Италии была создана на деньги меценатов, выступавших в роли заказчиков. Художественные мастерские были прибыльным бизнесом, в котором трудился не только сам художник, но и его подмастерья. Да-да, все художники ~~из черепашек-ниндзя~~ работали не за «спасибо», строчку в портфолио и потенциальное признание после смерти, а за очень даже реальные деньги.

Очевидно, уже тогда не всем это нравилось, и скупые дожи, не желающие платить за свой портрет в масле, начали продвигать тезисы в духе «Художник должен быть голодным».

Видимо, голодным он должен быть до своей смерти, а после неё какой-нибудь предприимчивый делец продаст его работы за баснословные деньги.

Знакомая история, не правда ли? У Марка Твена есть рассказ «Жив он или умер», в котором описан случай, когда несколько бедных художников решили объявить о смерти одного из них, чтобы привлечь внимание публики к его работам. Картины, естественно, поднялись в цене, и художнику наконец-то удалось выбиться из нищеты. И Твен, конечно, не один такой проницательный: эту тему культура уже успела обмусолить и высмеять.

В индустриальную эпоху разделение между художниками и всеми остальными стало ещё сильнее, поскольку их работа стала восприниматься как что-то непродуктивное, если сравнивать её с трудом фабричных рабочих.

Даже сейчас, когда дизайнерам и художникам платят точно так же, как и остальным работникам, сильно представление о том, что творческие профессии — это блажь. И это убеждение действительно сидит в голове заказчиков, как и то, что они хотят шедевр за отзыв (паблик «Дезигн» как одно большое доказательство такого явления).

Идея инаковости тоже имеет место: люди из креативных сфер часто в глазах остальных:

во-первых, занимаются не пойми чем в отличие от простых работяг;
во-вторых, обладают навыками, недоступными большинству;
а в-третьих, ещё и смеют наслаждаться своей работой!

Мне, кстати, кажется, что этот нарратив проталкивают и ИИ-компании через заявления по типу «ИИ помогает быть креативным всем, а не только узкой прослойке населения». Налицо попытка противопоставить благородных донов наглым художникам, дизайнерам и иже с ними.

А ещё — высосать конфликт из пальца, чтобы оправдать существование собственного продукта.

Отчасти вина на создании стереотипов лежит на самих специалистах, многие из которых готовы романтизировать плохие условия труда и низкую заработную плату, ведь их работа и так даёт им главное — возможность заниматься творчеством. Разделение труда и творчества, а также, в целом, индивидуализированный характер отрасли не позволяют креативщикам объединяться и отстаивать свои права при помощи профсоюзов.

Творческие профессии вообще очень странно уживаются рядом с капиталистическими ценностями. Дизайнеры и художники всё чаще работают на отдельные корпорации и компании, которые сами устанавливают и условия работы, и оплату, и вид конечного продукта. Если творчество так или иначе подразумевает экспериментальность и риск, то бизнес этот самый риск не любит: он хочет гарантированно получать прибыль, а потому неизбежно уменьшает автономность художников.

Кроме того, нельзя сбрасывать со счетов и общий культ продуктивности, который характерен вообще для всех областей — умри, но сделай. На таком фоне качество работ будет падать, потому что для чего-то хорошего нужны нормальные условия труда, наличие творческой свободы и соответствующая оплата в качестве мотивации.

Американский антрополог Дэвид Грэбер в своей книжке 2018 г. «Бредовая работа» говорит о существовании бесполезных работ, значение которых не понимают даже те, кто ими занимается, по типу различных менеджеров, администраторов, пиарщиков, а также о том, что такая бессмысленная работа наносит вполне серьёзный моральный и психологический вред и тем, кто ей занимается, и обществу в целом. Это вообще интересная книга, но меня сейчас интересует другое: помимо всего прочего, Грэбер прослеживает, как «бредовизации» подвергаются в принципе все профессии, в том числе и творческие.

Он говорит, прежде всего, о необходимости дополнительно выполнять бесполезную работу, например, перекладывать бумажки с места на место или ходить на никому не нужные встречи. Знакомо, да?

Но «бредовизации» творческие работы подвергаются и потому, что в них начинает пропадать сам элемент творчества. Дикие дедлайны и жёсткие требования компаний вынуждают специалистов всё чаще работать по шаблонам, отказываться от экспериментов и делать то, что точно купят потребители.

И именно в этой точке появляется генеративный ИИ и предлагает компаниям то, чего они так хотели. Использовать нейронки не только намного дешевле и гораздо быстрее, но ещё и безопаснее: ИИ не будет спорить и делать что-то, что ты не хочешь видеть в качестве результата.

Какая разница, если, как говорит Мира Мурати, CTO в OpenAI, заменять будут тех, чья работа и без ИИ не особо качественная? И, кстати, даже не обязательно теперь увольнять всех художников — они всё равно будут нужны, чтобы править картинки за ИИ. Только можно будет им меньше платить и устанавливать совсем маленькие сроки для работы. Бизнес и ничего личного.

Такая резкая перемена в сторону использования генеративного ИИ держится, как мне кажется не только на соображениях экономической выгоды, но и на нашей личной вере в него. Её отчасти нам успешно продают, отчасти она в нас и так уже жила, а теперь маркетинговые уловки лихо прорастают на подготовленной почве.

ИИ — вопрос веры

Ни для кого не будет секретом, что резкий взлёт генеративных моделей — это заслуга в том числе успешных маркетинговых кампаний. Продать можно вообще всё, что угодно: фарму, сигареты, бриллианты. Да так, что товар станет популярным, даже если для этого изначально нет никаких предпосылок.

Но в случае с генеративным ИИ нам продают ещё и мечту о прекрасном технологичном будущем. Мечту, где все, вне зависимости от уровня своих навыков, могут рисовать картины, писать стихи и сочинять песни. Трава будет зеленее, солнце светить ярче, а трансгуманизм обязательно наступит совсем скоро для всех и для каждого. Красота.

И поэтому ИИ-евангелисты, для которых технологический прогресс тождественен социальному, готовы грудью вставать на защиту сгенерированного контента: то ли ещё будет! Но заикнись про условия, в которых кенийские сотрудники для OpenAI отбирали контент для тренировки ИИ — и ты ретроград и луддит. Это другое. Да, сейчас результаты не ахти, но вы только подождите, и мы все заживём хорошо ~~и точно-точно коммунизм наступит.~~

И поэтому на все кривые-косые картинки закрывают глаза: ИИ же маленький пока, научится ещё. Кто-то может также сказать, что это вопрос эстетики, и некоторым реально нравятся ИИ-картинки. А я даже, пожалуй, соглашусь, но только отчасти: если бы человек был ответственен за те косяки, которые повсеместно можно найти на сгенерированных изображения, ему вполне резонно прилетело бы со всех сторон.

Но вот смотреть на лишнее количество конечностей и плохо прорисованные текстуры от ИИ — это всегда пожалуйста.

Мне неясна иррациональная злоба некоторых людей, которые с радостью заявляют: «Ну всё, скоро у этих дизайнеров отнимут работу!» Потому что зачем? Чтобы что? Зачем отнимать работу у людей, которым она нравится? И какая остальным от этого польза?

Складывается ощущение, что ИИ — это вопрос веры, причём веры слепой и требующей от себя никому не понятных жертв.

Нам казалось, что автоматизация заберёт у нас монотонную и физически тяжёлую работу, дав возможность заниматься чем-то, что нам действительно по душе. Но случилось ровно противоположное, и работу стали отнимать у тех, на кого мы 10 лет назад подумали бы меньше всего. Зачем нужно было заставлять ИИ генерировать контент и лезть в творческую сферу, когда вместо этого он мог бы, например, заниматься аналитической работой, прогнозировать риски, предлагать стратегии по продвижению продукта. Заменить, в конце концов, менеджеров и пиарщиков?

По моему глубокому убеждению, в духе лучших теорий заговора, реальную пользу генерация контента приносит пользу только компаниям. Одним, потому что они хотят экономить вообще на всём и получать больше денег. Другим, потому что им всё равно, что они делают и зачем, если речь идёт о технологиях (и о деньгах, конечно, тоже).

Но в вере сомневаться нельзя.

Возможно, выгодны нейронки и новым «ИИ-художникам». У некоторых из них я действительно находила что-то о об их художественном бэкграунде, но также видела и то, как они занимаются продажей NFT, крипты и ~~прочим скамом~~:

Да, это люди, которые умеют создавать деньги из воздуха, а ИИ — очередной способ это сделать. Может, я зря на них сейчас гоню бочку, и им реально нравится то, чем они занимаются (я имею все основания подозревать, что за нейронкой они дорисовывают большую часть изображений, но они сами не спешат рассказывать о процессе работы).

Пока ситуация выглядит так: небольшая группа людей нашла, как можно зарабатывать большие деньги, выступая ИИ-евангелистами, а влияет это на всех остальных их коллег по цеху. В то время как они зарабатывают, другие уже вынуждены за копейки обмазывать нейронные шедевры.

И что самое удивительное — все почему-то стесняются.

Не пишут огромными буквами на своих сайтах о том, как генерируют иллюстрации при помощи ИИ; нанимают художников, чтобы доводить результаты нейронок до ума, но кричат о технологическом прогрессе. Потому что понимают, что ИИ-работы плохие по качеству и до человека им ещё ой как далеко, а зарабатывать и экономить деньги хочется уже сейчас.

Для остальных обывателей ИИ — просто игрушка. Красивая, блестящая, но на деле быстро надоедающая консьюмеристская игрушка, которая едва ли способна подарить уникальный опыт. Неважно, говорим ли о самом процессе создания контента или о его потреблении.

Вместо выводов

Вряд ли все в массовом порядке откажутся от использования искусственно сгенерированного контента в ближайшее время. Точно так же вряд ли ИИ способен отобрать работу у дизайнеров и художников. Он не может этого сделать, зато может значительно подпортить им рабочую жизнь.

Грэбер в «Бредовой работе» был ужасно оптимистичен — успел, к его счастью, умереть до полного становления генеративного ИИ. Одним из решений по возвращению смысла в работу он видел введение безусловного базового дохода, чтобы у человека не было необходимости заниматься дурацкими обязанностями, чтобы заработать на хлеб, а тратить время и силы на что-то продуктивное и креативное.

Такой прогноз теперь выглядит издёвкой, когда балом правят нейронки: рисовать картинки и писать тексты, чтобы потом делиться ими с людьми, приятное занятие. Но несколько фрустрирующее, если знать, что плоды твоего труда однажды пережует и выплюнет очередная модель ИИ.

Ведь без человека генеративные модели мало на что способны. Даже если сейчас все компании дружно откажутся от труда людей, а те, в свою очередь, перестанут выкладывать свои работы в какой-либо доступ, нейронки долго без топлива не протянут. Потому что учиться им будет можно только на своих работах, с каждым разом выдавая работы всё хуже, хуже и хуже. Рано или поздно даже самый непритязательный потребитель завоет от деградации качества контента. Колесо Сансары даст оборот, и всё снова вернется к началу — к использованию работ человека.

Но это всё потом, в неопределённом и неясном будущем, о котором никто из нас не сможет сказать ничего конкретного. А пока посмотрите на китайских мудрецов в книжной миниатюре и будьте, как они: спокойными и невозмутимыми, словно Хуанхэ.

Статьи, которые могут быть интересны:

Подписывайтесь на блог и Телеграм-канал Alfa Digital — там мы постим новости, опросы, видео с митапов, краткие выжимки из статей, иногда шутим.

Хабы:

Что не так с ИИ-картинками

Любовь к ИИскусству

«ИИ-искусство — это искусство»

Первая часть: про творческий процесс

Вторая часть: творец и его инструмент

Юридические тонкости

Страх и ненависть на рынке креативных специальностей

ИИ — вопрос веры

Вместо выводов

Полезные ссылки

Программисты всё вымирают и вымирают

Дореволюционный Энциклопедический словарь Брокгауза и Ефрона

Не всё так просто с луддитами, как кажется

Кнопки в автомобиле — это уже роскошь

Великобритания, долги, Южные моря и Исаак Ньютон

Информация