Как стать автором
Обновить
166.63
Группа компаний X-Com
X-Com — крупный российский ИТ-холдинг

DALL-E 2 vs MidJourney: наш опыт практического применения нейросети для оформления сайта…и не только

Время на прочтение6 мин
Количество просмотров44K

Привет, Хабр! В этом посте я расскажу том, как мы на практике применили результат работы нейросети, почему решили использовать ИИ для отрисовки графики на сайте и предлагаю обсудить, какие вообще существуют перспективы в этой сфере для российского бизнеса. Под катом — наша история выбора и применения нейросети, а также несколько сгенерированных разными нейросетями наборов картинок с запросами, по которым мы их получили. 

Меня зовут Артём Попов, я — руководитель отдела маркетинга в интернет-магазине xcom-shop, и сегодняшний пост отражает отношение потребителя или, если хотите, заказчика графики. У дизайнеров постоянно не хватает времени на то, чтобы выполнять запросы всех бизнес-юнитов, а нам постоянно хочется чего-то этакого… Может, заказать отрисовку нейросети?

Раньше никто и не задумался бы о таком решении, но сейчас тема явно находится в зоне хайпа: про нейросети не слышал только ленивый. На прошлой неделе вышел лонгрид о возможностях нейросетей, позже мы всем рунетом ужасались реалистичностью “последнего селфи на Земле”, сделанного “руками” DALL-E 2. А благодаря тому, что редакция портала 72.ru поэкспериментировала со словами запросов, жители Тюмени (и все, кто неравнодушен к Тюмени) смогли взглянуть на свой родной край “глазами” нейросети MidJorney — результаты можно посмотреть тут.

Какую нейросеть выбрать?

Признаюсь честно, мы тоже все это читали и смотрели. И даже вдохновились качеством и глубиной сгенерированных картинок. После этого оказалось просто невозможно пройти мимо (мы ведь работаем в сегменте высоких технологий и должны идти в ногу со временем). А значит, мы в xcom-shop просто обязаны попробовать работу с нейросетью. 

Так начался выбор оптимального для нас решения. В фокусе оказались две наиболее раскрученные на данный момент системы. Ниже я постарался свести в единую таблицу их характеристики/плюсы/минусы:

Нейросеть

DALL-E 2

MidJourney

Разработчик

OpenAI

MidJourney (независимая группа разработчиков)

Дата запуска, текущий статус

20 июля 2022 (закрытый бета-тест) 

13 июля 2022 (открытый бета-тест)

Максимальный размер изображения

PNG, до 1024x1024 пикселей

JPG, до 1664x1664 (или другой до 3 миллионов пикселей)

Возможность менять масштаб

нет

да, можно задавать пользовательский размер изображения

Доступ

API (причем доступ из РФ закрыт)...тоже мне OPEN

Discord

Права на использование в коммерческих целях

Полные права на все сгенерированные изображения

По подписке (для компаний с оборотом от $1 млн. в год стоит $600)

Бесплатный лимит, стоимость

50 запросов в месяц, далее 115 запросов за $15

25 запросов бесплатно, 

далее по подписке

Субъективная оценка удобства работы с запросами

Нейросеть более чутко схватывает суть сложных запросов

Очень хорошие изображения даже по простым запросам

Субъективная оценка качества изображений на выходе

Удовлетворительный уровень качества и детализации итогового изображения.

Высокий уровень качества и детализации итогового изображения.

Но я практически уверен, что моя субъективная оценка вас не убедила. :) Делюсь изображениями, которые мы получили в ходе тестирования нейросетей по одним и тем же запросам:

Несмотря на то, что DALL-E 2, кажется, более тонко схватывает все нюансы запросов и, по моим ощущениям, дает более релевантные сложным текстам картинки, наш выбор все-таки пал на Midjourney. И на то несколько причин.

Главная — мы всем коллективом очарованы тем, как MidJourney видит наш xcom-shop в будущем.

Во вторых, этот вариант реально доступен для бизнеса без заморочек с VPN и правами на коммерческое использование. Заплатив $600 (714 с учетом налога) за корпоративный тарифный план, мы тут же отправились тестировать алгоритмы AI. Это, кстати, очень увлекательно, и в первый вечер я пересидел на работе 3 часа сверх нормы, играясь с веселыми картинками…зато ехал домой без пробок. ;)

Интересный факт, мы первые? Да!

“Автор, ты о чем?" — скажете вы. — "Уже многие компании использовали нейросеть для генерации изображений.” И будете правы! 

Например, Cosmopolitan заказал обложку алгоритму DALL-E 2 — получилось очень даже неплохо. А ранее The Economist использовал ИИ-бота для создания обложки тематического номера о современных цифровых технологиях. И не забывайте про “особого дизайнера” студии Лебедева, Николая Иронова, который уже больше года выполняет самые разные работы для заказчиков.

Но все они не интернет-магазины! И, судя по всему, мы — первый интернет-магазин в России, реально применяющий нейросеть на своем сайте. И не просто один раз разместив какой-то элемент, а на постоянной основе (само собой, мы ж подписку на год оплатили).

Решение практических задач

Что касается задач, мы решили не придумывать каких-то специальных выкрутасов для нейросети — я наигрался с ними в первый же вечер. Вместо этого мы сфокусировались на своих текущих потребностях. А именно - “подсветке” на сайте недавно выпущенного подборщика блоков питания.

Вообще это обычная практика — мы размещаем баннеры на главной и в соответствующем разделе каталога. Вот именно их создание мы и поручили нейросети.

На баннере нужно было показать креатив, связанный с блоками питания ПК, мощностью и энергией (сервис подбирает оптимальный БП под конфигурацию системного блока). Имея эти образы в голове, мы с дизайнером Ярославом Шиловым начали перебирать запросы для нейросети.

Вот несколько наших запросов и полученный для них результат:

На каждый запрос нейросеть представляет четыре варианта изображения на выбор. Это оказалось очень удобно: можно сразу сделать выбор и на основе понравившегося варианта получить ещё четыре скетча. А если какой-то вариант устраивает, можно улучшить его в качестве (сделать апскейл разрешения).

В запросах к Midjourney можно дополнительно указывать разрешение итоговых изображений, преимущественные цвета, художественный стиль и многое другое.

В поисках необходимого изображения было сделано более 30 запросов. Иногда нейросеть выдавала совсем неподходящие варианты, возможно из-за нехватки с нашей стороны опыта в написании запросов. Так что для планомерной работы (но крайней мере нам сейчас) нужен большой запас запросов. Но в итоге, уловив правильное направление, нам  удалось прийти к желаемому результату. 

На первом же опыте мы убедились в том, что нейросеть может ускорить рабочий процесс дизайнера. Обычно специалист тратит много времени на поиск идеи, графические ресурсы в открытом доступе и прочий креатив. Мы же в итоге решили эту задачу вдвое быстрее. Ну и, конечно, дизайнер получает уникальные материалы для дальнейшей работы, и ее результат будет отличаться от всего, что есть в сети. 

Да, в подборках встречалась какая-то ерунда. Но, проработав несколько запросов, волшебным образом мы получили то самое изображение, подходящее под нашу тематику.

Несколько доработок, добавляем текст, адаптируем под нужное разрешение - и вуаля! Картинка для баннера готова. И баннер уже красуется на нашем сайте.

Нейросеть – вдохновитель дизайнера

Помимо графики, которую дизайнер сможет использовать в своей работе, нейросеть обладает еще одним удивительным свойством, а именно – генерирует идеи. Для любого творческого специалиста это отличное подспорье. И мой коллега, дизайнер Ярослав Шилов подтвердил, что это именно так. 

В процессе работы с AI сложно не заметить, что некоторые изображения действительно бьют “прямо в точку”! Невольно задаешься вопросом – как раньше мне это не пришло в голову? Так что нейросеть совершенно точно можно использовать как бесконечный источник мыслей для вдохновения.

Дальше — больше

Итак, мы получили вполне себе положительные результаты эксперимента по использованию сгенерированных нейросетью изображений на нашем сайте и готовы идти дальше и масштабировать полученный результат. 

Однозначно, мы будем применять технологию для подготовки email-рассылок (следующую нашу еженедельную рассылку мы полностью составим из сгенерированных изображений, подписывайтесь).

Также будем генерировать визуалы наших постов в соцсетях исключительно через нейросеть. Весь август вести группы xcom-shop нам будет помогать робот. И для знатоков работы нейросетей мы приготовили забавный конкурс: Первый, кто угадает запрос, по которому мы сгенерировали изображение для поста - получит 1000 баллов на свой бонусный счёт, все подробности у нас в телеграм, ВК и Яндекс.Дзен.

Выводы

Конечно, пока рано говорить, что нейросеть способна полностью заменить дизайнера. Но уже сейчас искусственный интеллект может упростить работу специалиста, ответственного за подготовку графики. Ведь на отрисовку иллюстрации обычно и уходит большая часть времени дизайнера, а с этой задачей нейросеть уже сейчас справляется если не отлично, то уверенно хорошо. Важно только найти правильный подход и научиться формулировать запросы.

С другой стороны, пока роботу непосильны как минимум такие стандартные дизайнерские задачи, как набор текста, работа по брендбуку и правильное размещение логотипов. И тут как раз выручает дизайнер, который уже адаптирует сгенерированные AI изображения для решения вполне конкретных бизнес-задач. 

Возможно, скоро мы увидим в резюме дизайнеров в дополнение к привычной креативности, многозадачности и стрессоустойчивости (ну или виртуозного владения графическим пакетом Adobe/Corel) приписку вроде “уверенно ставлю задачи нейросети”. И как знать, может быть именно это станет конкурентным преимуществом при приеме на работу. 

А вы что думаете про результаты нашей работы с нейросетью? Делитесь в комментариях, давайте обсудим!

Теги:
Хабы:
Всего голосов 45: ↑42 и ↓3+39
Комментарии37

Публикации

Информация

Сайт
www.xcom.ru
Дата регистрации
Дата основания
1994
Численность
201–500 человек
Местоположение
Россия
Представитель
Андрей Митрофанов