Как стать автором
Обновить

Midjourney — нейросеть генерирующая картинки по текстовому описанию

Время на прочтение3 мин
Количество просмотров547K

В наше время нейросетью уже мало кого удивишь, эти штуки умеют обрабатывать видео, вести диалог с человеком, выполнять поиск материалов в интернете, писать музыку, распознавать объекты на фото, помогают обрабатывать фото и многое другое. Сегодня я хочу рассказать о сетке рисующей картинки — Midjourney.

Команда Midjourney позиционирует себя как независимую исследовательскую лабораторию, занимающуюся расширением творческих способностей человечества.

Проект был запущен в феврале 2022 ученым и предпринимателем Дэвидом Хольцом.

Давид Хольц — выпускник факультета прикладной математики Университета Северной Каролины в Чапел-Хилл. В студенчестве работал в Институте Макса Планка, где изучал алгоритмы нейровизуализации, также работал в исследовательском центре NASA и принимал участие в разработке технологии LiDAR (обнаружение и определение дальности с помощью света, технология используется, в том числе, в камерах iPhone).

Подробнее о личности основателя можно прочесть вот в этой заметке.

Midjourney является независимым самофинансируемым проектом над которым трудится команда из 11 штатных сотрудников, а также большое количество внешних консультантов. Перечень всех участников проекта доступен на официальном сайте проекта.

Работу Midjourney обеспечивают алгоритмы распознавания речи и алгоритмы создающие образы. Проще говоря, Миджорни умеет распознавать печатный текст и преобразовывать его в картинки. Для этого необходимо на английском языке описать сюжет, направить его на обработку сетке и дождаться результата. После полученный результат можно немного модернизировать, увеличить его качество и скачать.

Получаются вот такие картинки.

Сетка представлена в формате Дискорд-бота. Придуманный сюжет нужно направить боту в чат, а в ответ он пришлёт сгенерированную картинку.

Наличие такого инструмента в будущем очень сильно упростит работу дизайнера, решив проблему отсутствия контента на стоках, длительный поиск необходимых материалов.

Для быстрого создания контента понадобится воображение, умение структурировать информацию и интерпретировать ее в понятные словосочетания. Ну, круто же!

Я уверен, что никакие нейросети и Скайнеты не заменят дизайнера, но очень сильно упростят его работу.

Теперь о том, как протестировать это чудо техники. ?

Сейчас сетка находится на этапе открытого бета-тестирования, доступ может получить каждый. Для этого необходимо:

1. Перейти на сайт Миджорни — midjourney.com и нажать кнопку «join the beta».

2. Сайт перенаправит вас в Discord. Там необходимо авторизоваться или создать аккаунт. Авторизация через Дис обязательна — нейросеть работает в формате Дискорд-бота.

3. Далее нужно дать сетке необходимые разрешения.

4. После чего система вас может направить в личный кабинет Миджорни. Выглядит он как на скрине. Чтобы из кабинета попасть в Дискорд-бот нужно нажать на ваш аватар в нижней части экрана и выбрать пункт «Go to Discord». Может сразу направить в бот, бывает по-разному. ?

5. Открывшийся канал нейросети, будет выглядеть так.

6. Можно ознакомиться со справочной инфой в разделе «welcome», там кратко описано что к чему.

7. После чего нужно перейти в любой канал название которого начинается как newbies: «newbies-102», «newbies-132» и т.д.

8. Находясь в канале необходимо в текстовую строку ввести команду «/imagine promt» и текст сюжета, должно получиться как на скрине.

9. После того как будет вставлен текст нужно нажать энтер и можно наблюдать в реальном времени процесс генерации картинок. Это займет около минуты.

10. Можно не ждать — когда картинка будет готова нейросеть пришлет уведомление. Перейти к записи в канале можно через центр уведомлений Дискорда.

11. Ознакомившись с результатом, можно попросить сетку проработать варианты одного из сюжетов нажав одну из кнопок V1, V2, V3 или V4. Кнопки соответствуют одному из четырёх предложенных вариантов.

12. Кнопки типа U1 и т.д. необходимы для инициации процесса улучшения качества картинки — «upscale».

13. После того как картинка будет доработана ее можно скачать или ещё немного доработать, увеличить размер до максимума, а также оценить.

На GitHub существует более обширный гайд по работе с сетью. В нём доступны различные дополнительные команды и настройки.

Ссылка на гайд тут.

Стоит ещё добавить, что большинство продуктов делаются людьми для зарабатывания денег и Миджорни не исключение. Для тестирования работы сетки разработчиками бесплатно предоставляются «25 действий»: можно сгенерировать 25 сетов по 4 картинки в низком качестве или меньшее количество сетов и за оставшиеся баллы (действия) проработать варианты или увеличить качество изображений.

Когда лимит будет исчерпан бот пришлет вам вот такое уведомление.

Для увеличения лимитов можно перейти в админку сети и приобрести один из предложенных пакетов.

На этом у меня всё. Очень рекомендую протестировать сетку и очень жду, когда нейросети станут одним из инструментов дизайна, таким же привычным как Фигма или Фотошоп. ?

Теги:
Хабы:
Всего голосов 22: ↑18 и ↓4+19
Комментарии24

Публикации

Работа

Data Scientist
80 вакансий
Веб дизайнер
37 вакансий

Ближайшие события