Как стать автором
Обновить
315.8
BotHub
Агрегатор нейросетей: ChatGPT, Claude, Midjourney

Создаем комикс с помощью нейросетей: генерация идей, сюжета и визуального стиля. Часть 1

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров1.3K

Доброго времени суток всем любителям искусства и нейросетей. Хочу пригласить вас к прочтению статьи о том, как с помощью нейросети можно создать комикс. Прежде, чем перейти к делу, я хочу напомнить, что на данный момент в ИИ не хватает одной важной детали: “Человеческой идеи”.  Сегодня мы попробуем научить нейросеть “придумывать”, попросив её создать комикс. Что ж, задача сложная, но не переживайте, я уже всё подготовил, вам остается только взять кофе и печенье, да внимательно наблюдать за моими шагами.

Финальный кадр из комикса
Финальный кадр из комикса

Шаг 0. История и эволюция Комиксов

Перед тем как что‑то создавать, следует оказать уважение всем любителям комиксов, изучив историю и культуру данного творчества. На данный момент существует множество разных направлений: американские, европейские, японская манга, корейский вебтун. Почему «множество разных», если всего 4? Всё просто — каждый из четырех приведенных мной картинок с историей скрываются десятки жанров, тематик произведений, форматов, стилей. Свои истоки комиксы берут с наскальных египетских рисунков — петроглифов, уже тогда люди передавали свои мысли, чувства, эмоции и идеи через картинки. Гораздо позже развитие комиксов массово началось в США, в газетах и журналах. И вот уже в 1895 г. появилось произведение, ставшее дебютом комиксов. В газете «New York World» издательства Джозефа Пулитцера появился герой — Желтый мальчик, рожденный Ричардом Фелтоном Аутколтом (карикатурист); героя так прозвали в честь желтой рубахи, которую он носил. Это стало сенсацией, газеты редко использовали цвета, а тут ещё и нарисованный мальчик, с надписями на рубахе.

Разворот комикса с Мальчиком в желтой рубахе из газеты “New York World”
Разворот комикса с Мальчиком в желтой рубахе из газеты “New York World”

Подробнее ознакомиться с историей этого героя вы можете в журнале ToonsMag – там хорошо описана история зарождения и развития данного комикса,  а также присутствует анализ произведения.
После первой газеты с комиксом наступил Платиновый век (1905-1937 гг.), с мальчиком в желтой рубашке появилась целая серия комиксов Hogan’s Alley, появлялись новые истории и герои. Основное нововведение - баблы ( “пузырьки” с англ. –  текст посреди картинкой в специальных рамках в виде облаков); также сильно изменился стиль зарисовки от черно-белого до детализированных сложных изображений. После был Золотой век, наступивший в 1938 году и закончившийся в 55-ом. Его начало объявило появление первого комикса с Суперменом в Action Comics.  И так далее по списку явился Серебряный век, принесший коммерческий успех, а за ним последовал самый размытый Бронзовый век, когда в комиксах стали поднимать глобальные проблемы, такие как употребление веществ, табак, экология и другие. И вот настал Темный век (настоящее время), который начался в 1990-х и продолжается по сей день. Сегодня корейские вебтуны и японская манга вышли на мировой уровень и конкурируют с американскими супергеройскими комиксами. Конечно же появление нейросетей повлияло и на эту сферу в мире, именно поэтому сегодня мы попробуем создать и выпустить своё электронное произведение.

Шаг 1. Интродукция

Изучив культуру комиксов, следующим действием будет изучения процесса создания данного искусства. Я воспользуюсь для этого Perplexity.ai. У меня получился такой запрос:

Расскажи мне как в современном мире создаются комиксы. Найди гайды степ-бай-степ, роадмапы и другие статьи. Составь конспект общий для всего материала. Учитывай при поиске, что мой комикс будет небольшим - 3 разворота.

Ответ от Perplexity
Ответ от Perplexity

Я подробно изучил информацию с ЛитРес и BangBangEducation, предоставленных по запросу в первых ссылках, а значит самая актуальная информация. Итого, для комиксов основой является сюжет и визуальная составляющая, именно этим авторы цепляют фанатов. Перед созданием важно понять зачем и для кого вы создаете, а также определиться с тематикой. Идея готова? Отлично, теперь нужно прописать сценарий и структуру, определиться с чего будет начинаться комикс, где будет кульминация и чем завершиться. Так как я создаю комикс с помощью нейросетей, у меня получится опустить несколько шагов с заготовкой рисунка и после нескольких запросов сразу перейти к проверке логики моего комикса. И по всё той же причине, указанной ранее, ещё мне необходимо будет проверить все шаги создания, чтобы исключить недочеты, связанные с тем, как нейросеть связывала мои промпты. Итоговый план: Идея → Структура → Изображения → Проверка → Публикация. Первые 3 пункта будут оставаться за ИИ, моё вмешательство ограничиться лишь единичными промптами (я не буду делать корректировки дополнительными запросами, если вижу, что нейросеть справилась плохо – по новой пишу промпт), так вы сможете увидеть как именно ИИ создает комикс. А вот проверку и публикацию я решил оставить на человека, то бишь на себя, чтобы избежать простых недочетов.

С целью эксперимента, я попробую пару-тройку сборок из чат-ботов, чтобы посмотреть как нейросети от разных создателей справятся с поставленной задачей и чтобы получить разные комиксы

Шаг 2.  Собираем комикс

Для поиска нужных нам нейросетей воспользуемся агрегатором BotHub, чтобы не переключаться по 10 раз между вкладками и не заморачиваться с VPN. Вы можете воспользоваться им по реферальной ссылке, чтобы получить бесплатный тариф и 100к токенов.

Наша команда №1 - ChatGPT 4.5 preview - идея и структура; GPT-Image - картинки

У меня получилась настоящая команда “GPT”, сегодня они будут защищать честь OpenAI. У них будет стоять задача создать американский супергеройский комикс. Смотрим:

Идея + структура:

Открываю на BotHub чат с ChatGPT 4.5 (версия предпросмотра модели) и отправляю промпт:

“Ты — опытный сценарист и эксперт по созданию графических романов и комиксов в классическом американском стиле, вдохновленном Marvel, DC и другими известными издательствами. Твоя задача — придумать оригинальную и увлекательную идею супергеройского комикса, подробно расписать сюжетную структуру и подготовить четкие инструкции для генерации страниц комикса другим ИИ (GPT-Image). Главное в твоём ответе - это четко сформулированная идея комикса; доведенные до идеала реплики, которые передают настроение героев и мысль автора(тебя); готовые запросы для генерации изображений к твоим репликам. Условие для изображений: они должны быть в одном стиле и гамме, обязаны соблюдать последовательность повествования, нужно, чтобы реплики четко передавали сюжет и подчеркивали реплики. Подведем итог: в твоем ответе я жду, идею комикса, готовые реплики и промты для генерации изображений (подробные требования уже указаны)”.


Ответ от GPT 4.5
Ответ от GPT 4.5

Получил хороший ответ, без каких-либо подсказок чат-бот полностью сам создал комикс (в устном формате), где учёл все моменты, такие как: стилистическое яркое название, построил продуманный фантастический мир, создал портреты героев, сюжетную линию, учел все “правила” создания комиксов (знакомство, конфликт, кульминация, финал).

В ответе GPT 4.5 пропущены страницы и панели
В ответе GPT 4.5 пропущены страницы и панели

Единственное, что меня удивило это номенклатура страниц, я решил уточнить у ИИ, чем он руководствовался:

“Как ты нумеровал страницы и панели, ты составил все элементы повествования?”

Chat GPT 4.5 решил, что он помощник, а не автор. Намекну, ему, что сегодня придется поработать. Исправляю ситуацию:

Твоя задача полностью составить комикс с нуля и до полного представления в устном формате (без изображений и публикации). Доработай своё произведение, подготовь промты для всех панелей и добавь реплики, также не забывай об эмоциональных выражениях героев (задумчивый, удивленный, злой, осознавший, радостный)

Надеюсь одного запроса хватит, чтобы ИИ полностью сгенерировал комикс. Также я повысил креативность(температуру) на 1.2 (это 60% от того, насколько можно выкрутить показатель)

Заготовка для комикса после первой редакции. Смайл микрофона - реплики, оранжевые ромбы - промты для изображений
Заготовка для комикса после первой редакции. Смайл микрофона - реплики, оранжевые ромбы - промты для изображений

Отлично, редакция не совсем успешна, но уже лучше. Пусть это будет первым звоночком в этой работе, что ИИ не заменяет человеческую идею, но я не сдаюсь, поэтому просто заменю страницы 22-24 на страницу 22 (возмонжно в итоге будет другой номер) Обращаю ваше внимание на то, что в заключении в 3-ем пункте наша нейронка немного устала(отредактирую в отдельном чате), но не забыла, что GPT-Image друг GPT 4.5. Записывайте первое моё вмешательство.

Уточнение значение слов GPT 4.5
Уточнение значение слов GPT 4.5

После глубокого анализа GPT вывел итог, а я попросил его сформулировать предложение заново:

Итог описания значения + новая формулировка
Итог описания значения + новая формулировка

ИИ ушёл далеко от изначальной цели составления данной фразы, поэтому я придал ей следующий вид: “Линии и придание формы: тонкие, аккуратные линии, высокая детализация эмоциональных выражений персонажей и элементов окружения. Использование выразительных пауз и тщательно продуманных переходов между панелями для создания драматизма и усиления эмоционального восприятия сцен.

Ещё из недочетов, которые я увидел. Героиня Алекса местами стала Алексом, что является незначительное ошибкой, и не повлияет на мою работу.
Теперь у меня есть реплики и промты для изображений, а также общая характеристика для страниц. Не буду выпытывать из GPT 4.5 нужные мне детали, отдамся воле ИИ и воспользуюсь тем, что уже получилось. 

  1. Визуальная часть

Переключаю модель нейросети на GPT-Image (оставаясь в том же чате) и буду использовать данные мне материалы для генерации. В начале каждого запроса указываю Стиль, Цветовой тон и формат линий, а ниже реплики и подготовленные промты. Привожу для вас первый запрос для генерации:

Сгенерируй для меня панель 1 страницы 1 комикса "Стражи Астрала". Стиль: (MARVEL и комиксы DC: классическое оформление, американский винтаж.) Цветовой тон ( Эффект637): эмоциональное повествование — сине-голубые оттенки( дружба), темные оттенки (опасность и страх) бледно-теплые(уверенность, умиротворение). Линии и придание формы: тонкие, аккуратные линии, высокая детализация эмоциональных выражений персонажей и элементов окружения. Использование выразительных пауз и тщательно продуманных переходов между панелями для создания драматизма и усиления эмоционального восприятия сцен. Реплика в пузеры: Мои сны всегда были безопасным пристанищем, до этого момента... Что нужно изобразить: Алекс спит спокойно, вокруг мистическая атмосфера, спальня в полутонах синего.


Благодаря тому, что я пользуюсь разными моделями в одном чате мне не придется десятки раз переписывать, что я хочу получить комикс и тд. Мне нужно будет только меня реплики, концепцию изображения и номера страниц, панелей. 

первая попытка создания кадра номер 1
первая попытка создания кадра номер 1

GPT Image сделал Алексу мужчиной, что точно нужно исправить. Я попрошу его сделать Алексу девушкой и приведу описание героини. 

редакция первого кадра
редакция первого кадра

С первого раза не получилось получить нужное изображение. Попробую очистить чат от непригодных картинок и добавлю в изначальный запрос уточнение “девушка Алекса”.

итоговый кадр 1
итоговый кадр 1

Отлично, получилось шикарное изображение, соответствующее всему описанному в промте. 

В следующей панели есть описание эмоций,  с которыми звучат слова героини: “Алекса, удивленно пробуждаясь”. Я решил добавить в свой запрос пункт “Комментарий к реплике” - посмотрю как это влияет на изображение и решу буду использовать далее. Также уже сейчас, создавая второй промт, я подчеркнул для себя, что придется редактировать подготовленные GPT 4.5 запросы, например менять “она” на “Алекса” для конкретизации, ведь несмотря на контекст генерация одной картинки независима от другой.

Следующее изображение
Следующее изображение


Видно, что для связи с прошлым не хватает кровати на фоне, но цветовая гамма закрывает данный пробел и проблема не критична. 

панель 3
панель 3

Хорошо сохраняется образ героини, но вид леса сразу же после кадра в доме - плохой сигнал, по опыту ранее удаляю данное изображение и его промт и отправляю новый с редактированием: “Мрачно-фантастическая сцена с силуэтом страшного существа в дымке в комнате Алексы” из “Мрачно-фантастическая сцена с силуэтом страшного существа в дымке.”
После данного изменения я столкнулся с проблемой модерации запроса. Не вижу ничего запрещенного в словах “в комнате Алексы”, поэтому чтобы не делать лишней работы, с помощью GPT 4.5 переписываем описание к кадру:

Хорошо, что есть выбор из нескольких вариантов, я посчитал первый самым подходящим.

отредактированная панель 3, ведь первая версия не подошла
отредактированная панель 3, ведь первая версия не подошла

Вот какой кадр получился в итоге, результат поражает, уже сейчас на первых панелях чувствуется нечто фантастическое. 

С следующим запросом та же история, на этот раз поменяю реплику, описание изображения и комментарий, так как везде есть сомнительные фразы, которые можно принимать по разному – думаю дело может быть в них. Мой запрос: “Измени реплику, комментарий и описание изображения так, чтобы они прошли модерацию модели GPT-Image (и далее изменяемые)”

Какие изменения произошли
Какие изменения произошли
второе появление монстра в комиксе
второе появление монстра в комиксе

Наш монстр сильно изменился за одну лишь смену кадра, вновь удаляю старый запрос и создаю новый с добавлением слов “Сохрани злодея каким он был, с рогами и острыми пальцами”.
Редакция успешна! Монстр снова такой, каким был, но заговорил на английском, быстро меняем и получаем итоговый вариант панели 4: 

Кажется устал не только GPT 4.5, но и GPT Image. Попытка вернуть облик монстру
Кажется устал не только GPT 4.5, но и GPT Image. Попытка вернуть облик монстру


Момент очень смешной, делаю ещё одну попытку, если не получается - меняю текст самостоятельно в фотошопе. 

успешное возвращение облика монстру. Отлично, фотошоп не пригодился!
успешное возвращение облика монстру. Отлично, фотошоп не пригодился!

На следующих страницах новых проблем не возникло, но встречались всё те же, поэтому фразы героев я стал подписывать как “Реплика на русском языке”. Ошибка генерации из-за модерации же никак не лечиться кроме как исправлением запроса. Иногда приходилось рерайтить описание изображение, так как оно было слишком размытым, например “Крупно лицо Алексы, облегчение”, поэтому я стал сразу просить GPT 4.5 переписать реплику, комментарий и описание изображение. Так получились более полная характеристика страницы комикса.  Чтобы вы не устали читать, я перейду к завершению. 

Помните, что чем дальше развивается сюжет, тем больше подробностей съедает GPT 4.5 (пример ниже в картинке)

Я решил попробовать создать целый разворот всего лишь на одной картинке, а не сразу урезать его в один кадр:

первое создание целого разворота одним изображением.
первое создание целого разворота одним изображением.

Получилось довольно странно, подобный разворот будет сильно выделяться из всего комикса, поэтому возвращаюсь с изначальному плану заменить несколько страниц на одну. Это я сделаю с помощью GPT 4.5, попрошу его расписать уже имеющиеся заготовки как один кадр. 

из страниц 4 и 5 у меня вышла одна картинка, которую я размещу как страницу номер 4.
из страниц 4 и 5 у меня вышла одна картинка, которую я размещу как страницу номер 4.

Результат удовлетворяющий, несмотря на то, что у героини слегка изменились волосы, опять же это малозначимая деталь. Тактика рабочая, значит можно пользоваться.

Я создал изначальный запрос:

Панель 1-2: В городе появляется необычная фигура (Мастер Эфир). Сияющая, завораживающая. 🎤 (голос Эфира, спокойный-вдохновенный): "Началось. Новое сознание пробудилось..." 🔸 Панель яркая, мистическая, Мастер Эфир парит над городом, ореол энергии вокруг. Панель 3-4 (реструктуринг города на Астрале): Мастером Эфиром окружает город иллюзорной стеной света. 🎤 "Молодое сознание - новая надежда и новая угроза." 🔸 Город покрывает блестящая астральная защитная энергия Мастера Эфира. Повтори задачу отдельно для панель 1-2 и панель 3-4. Выводи без смайликов в формате: Реплика на русском языке: измененные слова Комментарий к кадру: измененный комментарий Описание изображения: измененное описание Запомни для последующих промтов: Текст после "🔸" - описание, после "🎤" - реплики, всё остальное - комментарий

Затем я отправлял заготовки и получал идеальный ответ:

Пример того, как я расписывал описание нескольких страниц
Пример того, как я расписывал описание нескольких страниц

Чтобы вы не утомолисьИ вот финал. Мой комикс готов - знакомьтесь, “Стражи Астрала”(кликабельно). После создания и проверки комикса вот что могу вам сказать. Это возможно, у меня получился приемлемый комикс. Не хватает деталей, есть такие недочеты, как ошибки в тексте, один персонаж выглядит по-разному – конечно я мог это исправить несколькими запросами, но решил оставить эти ошибки, чтобы наглядно вам показать, как ИИ справляются с задачей создания комикса. В целом Стражей Астрала можно отнести к Платиновому веку, но по качеству изображения на некоторых кадрах он лучше современных(Темного века). Хочу похвалить мощности GPT Image, у него отлично получается передавать на картинках нужное настроение и эмоции, а вот GPT 4.5 подкачал, обрезав детали основной части сюжета. 

Для создания книги, с которой вы можете ознакомиться я использоваться сайт FlipHTML5, по бесплатной подписке на 7 дней вы сможете создать там, например свой комикс или книгу, там есть много шаблонов и функций для создания цифровой литературы.

Статья уже вышла очень объёмной, поэтому другие команды моделей будут в следующих частях. Общий вывод в последней.

Спасибо за уделенное внимание и время! Ждите продолжения!

Теги:
Хабы:
0
Комментарии3

Публикации

Информация

Сайт
bothub.chat
Дата регистрации
Дата основания
Численность
11–30 человек
Местоположение
Россия
Представитель
Вероника