Tsarek 22 июн 2023 в 13:38

Как использовать Midjourney: подробный гайд, лайфхаки, промты

Простой

7 мин

115K

Блог компании РСХБ.цифра (Россельхозбанк)Научно-популярноеМашинное обучение*Искусственный интеллект

Туториал

✏️ Технотекст 2023

Ранее мы рассказывали о своих впечатлениях и результатах тестирования приложений на основе нейросети. В работе над платформой «РСХБ в цифре» мы активно используем Midjourney. В новой статье хотим поделиться своими наработками, которые помогут с нуля разобраться в основных функциях и командах (версия Midjourney 5.1), чтобы приступить к созданию интересных изображений с помощью этого приложения.

Сейчас использовать Midjourney можно только через Discord, где создается учетная запись. Midjourney отображается в Discord отдельным общим сервером, где разные пользователи генерируют изображения в общих чатах. Ещё бота можно добавить на свой личный сервер и взаимодействовать без посторонних людей.

На изображении отмечены общий сервер Midjourney с различными каналами для генерации изображений, и личный, в который можно добавить чат-бот.

Как работают команды Midjourney в Discord

Взаимодействие с ботом Midjourney в Discord происходит с помощью команд. Команды используются для создания изображений, изменения настроек по умолчанию, отслеживания информации о пользователе и выполнения других полезных задач.

Основные команды

/imagine — генерирует уникальное изображение из короткого текстового описания.

/settings — открывает поле с упрощенными настройками генерации, качества, приватности и т. д.

В окне быстрых настроек можно выбрать:

версию Midjourney;
режим рисования в анимационном стиле (Niji);
параметр «Style» (по умолчанию стоит 100 или «Style med», но для придания изображению большей художественной выразительности его можно увеличить);
«Public mode» включен по умолчанию; возможность сделать фотографии недоступными для публичного просмотра другими участниками есть только в самом дорогом тарифе , команда также активируется через /private;
«Fast mode» или скорость генерации (по умолчанию стоит быстрая или «Fast mode» — если убрать данный режим, то не будет тратиться машиновремя подписки, но генерация изображения может длиться довольно долго, команда также активируется через /relax);
«Remix mode» дает возможность вносить изменения в запрос при использовании параметра «Make Variations» после увеличения изображения (об этом чуть ниже);

/info — вызывает окно с информацией по подписке.

/subscribe — вызывает окно с возможностью перехода к тарифным планам.

/blend — помогает скрещивать изображения, когда мы хотим из нескольких получить нечто общее. Без этой команды тоже можно создать смешанное изображение, но подгружая несколько ссылок и описывая результат.

/prefer option set — позволяет сохранить часто используемые настройки: вводим команду, далее указываем название для настройки, а после сам параметр через элемент «--».

Пример:

/prefer option set mine --hd --ar 16:9 промт создает опцию под названием « mine», при вводе которой в строку запроса как --mine Midjourney будет считывать ее как --hd --ar 16:9

Все созданные настройки можно посмотреть через команду /prefer option list.

/help — показывает полезную информацию и советы о боте Midjourney.

Подробнее про генерацию изображений с /imagine prompt

1. Введите /imagine prompt: или выберите /imagine команду во всплывающем окне команд с косой чертой.

2. Введите описание изображения, которое вы хотите создать, в prompt поле.

3. Отправьте свое сообщение.

Midjourney Bot лучше всего работает с простыми короткими предложениями. Длинные запросы могут ломать логику на сгенерированном изображении или приводить к некачественным результатам.

После завершения генерации появляются изображения и несколько дополнительных командных кнопок:

U1 U2 U3 U4

Кнопки U масштабируют изображение, создавая увеличенную версию выбранного изображения (увеличенное изображение будет немного отличаться от оригинала).

V1 V2 V3 V4

Кнопки V создают небольшие вариации выбранного изображения сетки. При создании варианта создается новая сетка изображения, аналогичная общему стилю и композиции выбранного изображения.

Кнопка «Обновить» генерирует новые изображения под текущий запрос.

После использования масштабирования изображения (Кнопки U) появится новый набор параметров:

«Make Variations» создает новый набор из четырех вариантов на основе текущего.

«Web» открывает изображение в своей галерее на Midjourney.com.

«Favorite» помогает отметить лучшие изображения, чтобы их было легко найти на веб-сайте Midjourney.

Недавно была добавлена новая функция «Remaster», не просто генерирует варианты по запросу, а дорабатывает уже сформированный вариант.

Чем крупнее объект на изображении, тем больше шансов, что «Remaster» сработает хорошо. Чем мельче детали, тем сложнее Midjourney заметить и переосмыслить их.

Сейчас функцию «Remaster» убрали, появится ли она снова — ответа нет.

Для получения результата, максимально приближенного к желаемому, запросы в Midjourney лучше писать, придерживаясь определенной структуры после /imagine prompt:

1. сюжет изображения;

2. стиль изображения;

3. информация о размере, освещение и т.д.

Для разделения запроса на составляющие необходимо использовать запятые или двоеточие (при необходимости строгого разграничения).

Пример:

beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day: : illustration style: : --ar 16:9

Дополнительные установки в запросах

Важно! Midjourney одинаково воспринимает два коротких дефиса «--» и длинное тире «—»

--ar — устанавливает четкое соотношение сторон.

--q — устанавливает качество изображения; по умолчанию качество равно 1 (--q 2 – увеличивает детализацию, но тратит больше машиновремени, --q 0.5, --q 0.25 соответственно, уменьшает качество, но тратит меньше машиновремени; --q 5 – экспериментальная настройка)

--no — исключает детали, например «--no cow» будет означать отсутствие коров на изображении (во всяком случае Midjourney попытается их не делать).

--uplight — позволяет при масштабировании изображения (кнопка U) уменьшить отличие от оригинала (при увеличении изображения всегда есть небольшая разница, особенно в небольших деталях).

::<число> — если добавить значение от -1 до 2 к любому слову в запросе (в данном случае без пробелов), можно распределить условный вес запроса, то есть важность той или иной подсказки перед другими. По умолчанию значение 1. -1 -0.5 равно команде –no.

Пример:

по запросу «/imagine prompt: hot dog::1.5 food::-1» будет создана «горячая собака», не еда; а по промту «hot dog» будет создана сосиска. Если использовать просто «/imagine prompt: hot:: dog» разделение будет аналогичное.

Разные результаты генерации разных запросов

Когда двойное двоеточие «::» используется для разделения подсказки на разные части, можно добавить число сразу после двойного двоеточия, чтобы назначить относительную важность этой части подсказки.

Пример:

hot:: dog сгенерировал горячую собаку. Изменение подсказки на hot:: 3 dog делает слово «горячий» в два раза важнее слова «собака».

--iw <число> — устанавливает вес изображения относительно веса текста.

--chaos <число> — вносит разнообразие в результаты. Диапазон значений от 0 до 100. Чем выше значение, тем необычнее будет композиция, но в ущерб самому запросу.

Пример:

beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day, illustration, wallpaper --ar 16:9 --chaos 100

Пример:

beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day, illustration, wallpaper --ar 16:9 --chaos 0

На втором изображении в запросе мы лишь изменились число, написав «0» вместо «100», а результат получили совершенно иной.

--seed — применяется при необходимости создавать максимально похожие изображения; диапазон значений от 0 до 4294967295. Если параметр не указан, автоматически выбирается случайное число.

Пример:

beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day, illustration, wallpaper --ar 16:9 --seed 1234567

--s <число> — стилизация изображения: чем выше значение, тем выше стилизация.

Например, «--s 500».

Немного о дополнительных промтах

Ракурс, угол, план и освещение

Берем промт:

beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, wallpaper --ar 16:9

Изображениям в Midjourney можно задавать ракурс. Мы можем получить как портрет, так и вид с высоты птичьего полета. Сразу уточню, срабатывает не всегда на 100%, т.к. очень многое зависит от длины и сложности самого запроса, но, тем не менее, знать об этом стоит.

Когда необходимо получить изображение с прямой перспективой, то дополнительно следует указать «Looking into the camera» или «full-face». Однако Midjourney часто сам предлагает именно такие визуалы.

Если требуется вид сверху, то самые простые варианты «drone shot photo of» или «birds-eye-view photo». Варианты похожи, но также могут варьироваться в зависимости от запроса.

Пример:

Drone shot photo of Beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, wallpaper --ar 16:9

Пример:

birds-eye-view photo Beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, wallpaper --ar 16:9

Также можно немного приподнять угол обзора при помощи ввода указания «High- angle photo of» или опустить камеру через запрос «a hip/knee/ground level shot of» (срабатывает чаще) или «view from below».

Результат использования запроса «view from below»

Вид снизу и не очень (иногда и такое бывает). Иллюстрации ниже.

При необходимости получить определенный угол обзора, используем «in profile», «three quarter view», «back view». Сразу уточню, что на людях данные настройки работают определенно лучше, но т.к. у нас корова, будем работать с ней.

Использование «in profile»

Результат использования «three quarter view»,

Использование «in profile»

Изображение можно сделать разного плана: портрет, средний план, в полный рост или издалека. Для этого к запросу добавляем «closeup photo» или «closeup shot», «medium-full photo/shot», «full photo/shot» или «full body photo/shot».

Соответственно, если хотим изобразить группу объектов, помещающихся на изображении целиком или видимые издалека, используем «long photo/shot», «a wide photo/shot» и «view from afar». Попробуем также эффект рыбьего глаза или «GoPro».

Важно! Обратите внимание: использование в запросе противоречащих друг другу описаний не будет приводить к желаемым результатам, например, мы хотим получить вид издалека, но, при этом, указываем на довольную морду коровы или высокую детализацию шерсти.

Для примеров «long photo» и «view from afar» сделаем запрос чуть проще: cow in a meadow, --ar 16:9»

Эффект рыбьего глаза тоже выглядит довольно интересно, добавляем «GoPro»

По вариантам простого освещения все предельно легко. Необходимо просто указать в запросе тот временной интервал или источник света, который необходимо получить, например: «sunny afternoon», «daylight», «incandescent light», «backlighting» и т.д.

В конце

Midjourney является отличным инструментом для дизайнеров, иллюстраторов и многих других людей творческих профессий. Этот инструмент позволяет воплощать в жизнь самые смелые идеи, создавать необычный и уникальный контент в различных стилях и вариациях. Желаемый результат не всегда получается с первого и даже с десятого раза, но, тем не менее, пробуйте и экспериментируйте.

Хабы:

Как использовать Midjourney: подробный гайд, лайфхаки, промты

Как работают команды Midjourney в Discord

Основные команды

Подробнее про генерацию изображений с /imagine prompt

Дополнительные установки в запросах

Немного о дополнительных промтах

Ракурс, угол, план и освещение

В конце

Публикации

Информация