Конечно же, не в смысле нажимают не те кнопки. В смысле - ждут от неё совсем не того.

Midjourney - сложный инструмент с очень плохим маркетингом и высоким порогом входа. Написал пару слов - и получил что-то рандомное. Написал то же самое в Nano Banana или GPT Image 1.5 - получил ровно то, что просил. Вывод напрашивается сам - MJ устарела. И я постараюсь вам доказать, что данный вывод - неправильный.

И дело тут не в технологии. 

Чуть больше года назад VEO 3 подняла планку генерации видео на ранее недосягаемый уровень. А через полгода вышла Sora 2 и показала невиданную до этого физику. Теперь вот релиз SeeDance 2.0 со своим нереальным контролем камеры и кинематографичностью. И знаете что? Я думаю, что это всё только начало потрясений от масштабов развития технологий в этом году.

Так что все дело тут в том, что большинство людей чувствуют и понимают нейросети с точки зрения математической точности, а не художественности. И это примерно как оценивать джазового музыканта по умению играть гаммы строго по нотам.

Почему новые модели всегда побеждают в сравнениях

Ответ простой. Их проще оценить.

Скажешь любой современной нейросети: "Нарисуй семь синих котов за столом, пятый держит карту пик, на столе три бокала и стакан виски" - она сделает. Посчитает котов, расставит бокалы, нарисует карту. А это уже, как минимум, продает само себя. Результат очевиден и измерим за три секунды.

Вариант от Nano Banana PRO
Вариант от Nano Banana PRO

Midjourney может перепутать котов. Но у неё на столе будет воздух, тень от бокала ляжет правильно, один из котов будет смотреть куда-то в сторону - и именно это делает кадр живым. Но живость не вписать в сравнительную таблицу. Поэтому в большинстве обзоров MJ сдает позиции. Цифры не врут - они просто меряют не то.

Вариант от MJ
Вариант от MJ

Хайп вокруг новинок понятен и закономерен. Nano Banana, Seedream, Grok Imagine - все они снижают порог входа до минимума. Для пользователя, которому нужен мем, открытка или пост в соцсети, точность следования инструкции важнее всего остального. Но реальное применение MJ начинается там, где заканчивается точность запроса.

Что происходит с картинками, которые слишком правильные

Посмотрите на коммерческие иллюстрации из новых моделей. Они безупречны технически. Свет выставлен идеально - будто работали три профессиональных софтбокса без единой лишней тени. Кожа персонажей гладкая и равномерная. Ни одного случайного элемента в кадре.

Именно это их и убивает.

Промпт для Nano Banano PRO (с прикрепленным референсом): Портрет уверенной в себе девушки сидящей на полу студии в свободной темно красной кожаной куртке (которая спадает с одного плеча открывая плечо) и подходящих к ней высоких сапогах на шпильке, очень короткие шорты, которых не видно. минималистичный фон в нейтральных серых тонах, мягкое студийное освещение,  волнистые блестящие волосы собранные с одной стороны чёрным зажимом, естественный гламурный макияж с едва заметными контурами, непринужденно шикарная поза, современная эстетика высокой моды, редакционный стиль Vogue, ультрареалистичная фотография 8k, кинематографический тон, сбалансированная композиция, утонченное и минималистичное настроение. Голова опирается на руку. Не меняй черты лица.

Глянцевая тетенька в исполнении Nano Banana PRO
Глянцевая тетенька в исполнении Nano Banana PRO

Мы подсознательно ищем несовершенства - они сигнализируют о том, что объект реален. Пленочное зерно. Чуть пересвеченный угол. Мазок, который немного выходит за контур. Неровный контровой свет с улицы. Без этих деталей изображение выглядит стерильным. Красивым - да. Но стоковым.

Возможно, именно поэтому крупные рекламные агентства до сих пор платят фотографам за съемку с намеренными несовершенствами. Аудитория устала от идеальных картинок - они воспринимаются как реклама, которую нужно проигнорировать.

Midjourney умеет генерировать несовершенства намеренно. В её алгоритм заложено понимание фактуры: текстура холста, характер карандашного штриха, сложный свет с несколькими конкурирующими источниками, зернистость аналоговой пленки. Это не баг и не случайность - это причина, по которой дизайн-студии не уходят, пока техноблогеры пишут некрологи.

То, за что профессионалам и платят

Если остаться на уровне "написал промпт - получил картинку", Midjourney действительно мало чем отличается от обычного стока. Но что же тогда отличается? И тут на сцену выходят уникальные параметры.

Параметр --sref - Style Reference. Загружаете любой визуальный референс: кадр из фильма, фотографию, скетч, обложку книги. Midjourney переносит его эстетику на новый сюжет. Не цветовую схему и не расположение объектов - именно вайб. Характер работы с тенями, плотность линий, настроение. Показываете один кадр из "Бегущего по лезвию" - дальше генерируете городские сцены с той же атмосферой, но со своими персонажами и историей.

Промпт для MJ: A lonely woman waving slowly toward the viewer in a dark, rain-soaked city at night, neon lights flickering, heavy shadows swallowing the scene, unsettling and emotional atmosphere, her face partially hidden in darkness, subtle motion blur on her hand, cinematic composition, deep blacks, high contrast, film grain, slightly desaturated colors, haunting and ominous mood, realistic, no text

Без параметра --sref
Без параметра --sref

К слову, конкуренты пытаются делать похожее. И чаще всего - получается хуже. Они копируют поверхность - схожую палитру и приблизительную композицию. Midjourney попадает на уровень глубже - в характер самого изображения.

А теперь с параметром --sref и прикрепленным скрином из знаменитой сцены "Бегущий по лезвию 2049", где герой Района Гостлинга встречает голограмму
А теперь с параметром --sref и прикрепленным скрином из знаменитой сцены "Бегущий по лезвию 2049", где герой Района Гостлинга встречает голограмму

Параметр --cref - Character Reference. Держит персонажа стабильным через разные сцены, ракурсы и освещение. Загрузили один исходник - получили десятки изображений с тем же героем в разных ситуациях. Представьте, что это означает для брендов, которые строят коммуникацию вокруг одного визуального героя или маскота.

Менее известный, но крайне полезный - параметр --stylize (сокращенно --s). Он управляет тем, насколько сильно Midjourney интерпретирует ваш запрос через собственный художественный вкус. Значения от 0 до 1000. По умолчанию стоит 100.

При низких значениях - 20-50 - MJ буквально следует промпту. Результат точный, предсказуемый, но сухой. При высоких - 600-900 - система начинает принимать собственные решения: добавляет детали, которые вы не просили, уходит в сторону от буквального описания. Именно здесь появляется та самая атмосфера, которой нет у конкурентов.

И это только малая часть того, что умеет MJ.

Месячная подписка стоит от 10 долларов на официальном сайте. Одно качественное фото на легальном фотостоке - столько же или дороже. Для тех, кто пока не готов оплачивать отдельную подписку или возиться с иностранными оплатами: Midjourney работает и через платформу Study AI.

Что за история с Discord

Со старта - главным неудобством была сама платформа. Команды в публичных чатах, синтаксис слэш-команд и необходимость разбираться в механике Discord отпугивали всех, кто привык к нормальному интерфейсу.

И многие пропустили момент, когда это изменилось. Нейросетевые ответы до сих пор используют этот факт как минус MJ. Не дайте себя запутать.

Аж в далеком 2024 году Midjourney запустила полноценный веб-интерфейс. Сейчас это нормальная рабочая станция: галерея с поиском, история всех генераций, визуальные настройки параметров без ручного ввода команд. Есть инструменты организации проектов - папки, теги, фильтрация по стилю и дате. Когда работаешь над большим проектом и генерируешь сотни итераций за неделю, возможность быстро найти удачный вариант четырехдневной давности становится критической. 

Кстати, ни один из хайповых конкурентов полноценного архива не предлагает.

Где конкуренты объективно лучше. И это - нормально

Да, несомненно, есть задачи, ради которых идти в Midjourney - очень плохая идея.

Точные технические схемы, иконки для интерфейса, инфографика с читаемым текстом, иллюстрации с фиксированным количеством объектов - всё это MJ делает плохо или непредсказуемо. Если нужен логотип с конкретной надписью без артефактов - берите другой инструмент. Если нужна диаграмма - тем более.

Это не слабость. Это честное разграничение областей. Скальпель не заменяет молоток, и наоборот.

Промпт для MJ: A spy with an eye mask on. You can see his two eyes. The color scheme is black and red. Vintage vibe. Glitches. --ar 16:9 --raw --stylize 78 --profile hcwidnd

Нужен ли MJ контенту?

Поисковые алгоритмы Яндекса и Google давно обучены определять популярные стоковые фотографии. Изображение, которое уже стоит на тысячах страниц, не помогает ранжированию страницы и не удерживает внимание читателя. Midjourney генерирует контент, которого нигде раньше не было.

С ростом нейросетевого контента главным полем боя для авторов стало внимание пользователя.

Опытный читатель сгенерированное листает не глядя. Уникальная картинка его тормозит - и это уже мелкий, но реальный сигнал для алгоритма и заметный фактор для поведенческих метрик.

Редакции, которые это поняли раньше, получили бесконечный источник материала под любую тему.

Стоит ли дать Midjourney второй шанс в 2026 году?

Midjourney - не генератор картинок с хорошим качеством. Это инструмент с художественным мышлением, который плохо работает у тех, кто не умеет с ним разговаривать.

Потратить один вечер на гайды, поэкспериментировать с --sref и --cref, посмотреть, как работает персонализация через --p - и, уверяю, вы влюбитесь в нее.

Пока остальные нейросети соревнуются в том, кто точнее нарисует глянцевых студийных дамочек, Midjourney учится живописи. Разные цели. Разный результат.