Теперь вы можете генерировать гиперреалистичные ИИ-изображения в промышленных масштабах бесплатно.
За последние несколько лет индустрия генераторов изображений на базе ИИ выросла в геометрической прогрессии.
До июля 2024 года лидерами рынка моделей генерации ИИ были Midjourney V6.1, Dalle-E 3 от OpenAI и Stable Diffusion от Stability AI (с открытым исходным кодом).
Однако 1 августа стартап под названием Black Forest Labs выпустил версию FLUX.1, которая шокировала некоторых экспертов отрасли и заставила занервничать некоторые ведущие компании, разрабатывающие ИИ-генераторы изображений.
Новичок в сфере ИИ - Flux.1
FLUX.1 - это набор моделей, обеспечивающих новый уровень детализации, соблюдения промптов, разнообразия стилей и сложности сцен для преобразования текста в изображение.
Стартап создан командой, в которую входят первоначальные разработчики технологии, лежащей в основе Stable Diffusion, и изобретатели скрытой диффузии.
FLUX.1 имеет три модели, которые представлены ниже:
Flux.1 Pro
Это флагманская модель, которая обладает исключительными возможностями по обработке промптов, визуальному качеству, детализации изображений и разнообразию выходных данных.
В ней используются передовые ИИ-технологии, включая диффузионные модели и трансформаторные архитектуры, что позволяет ей генерировать высококачественные изображения, которые соответствуют сложным текстовым промптам.
Эта модель доступна в основном через API и подходит для коммерческого использования, что делает ее идеальной для профессиональных приложений.
FLUX.1 Dev
Это усовершенствованная версия FLUX.1 Pro, разработанная специально для некоммерческого использования.
Она обеспечивает такое же качество и соблюдение промптам, как и FLUX.1 Pro, но при этом более эффективна, чем стандартные модели того же размера.
Эта модель имеет открытый вес, что позволяет пользователям получать доступ и использовать ее в личных и исследовательских целях без коммерческих ограничений.
FLUX.1 Schnell
Это самая быстрая модель из набора моделей FLUX, оптимизированная для локальной разработки и индивидуального использования.
Она находится в открытом доступе под лицензией Apache 2.0, что делает ее доступной для пользователей, которые хотят поэкспериментировать с генерацией ИИ изображений без ограничений, связанных с коммерческим лицензированием.
В этой модели приоритет отдается скорости и эффективности, что делает ее подходящей для быстрого создания прототипов и личных проектов.
Как получить доступ к моделям FLUX.1
Лучший способ получить доступ к модели FLUX.1 - через Hugging Face, известную ИИ-компанию и платформу сообщества, ориентированную на обработку естественного языка (NLP) и машинное обучение.
Эта платформа стала центральным хабом в ИИ-сообществе. Чтобы использовать нужные модели, зайдите в пространство и выполните поиск.
Для FLUX.1 DEV вы можете напрямую перейти в пространство FLUX.1 Dev, а затем ввести промпт для генерации изображения.
После ввода нужного промпта нужно нажать «Run», и изображение будет сгенерировано.
Промпт: Halloween night scene with a carved, aged pumpkin glowing from within. It sits on a dry tree stump in an abandoned rural landscape, with an old, blurry house in the background surrounded by dry overgrowth. The sky is cloudy and gray, creating a cold and eerie atmosphere.
Аналогичным образом можно получить доступ к пространству FLUX.1 Schnell и генерировать изображения. Однако официальных пространств для доступа к FLUX.1 Pro через Hugging Face не существует.
Одна из проблем использования Hugging Face заключается в том, что у него есть ограничения на количество использований. Это происходит потому, что он позволяет всем желающим использовать модели, размещенные на хостинге, что приводит к увеличению времени ожидания.
Black Forest Labs заключила партнерство с несколькими партнерами, такими как fal.ai, replicate, Freepik и многими подобными платформами. Есть бесплатные и платные тарифные планы, и вы можете выбрать их в зависимости от ваших потребностей.
Кроме этого, Flux интегрирован в телеграм-бот SYNTX (вплоть до модели Pro), причем там реализован весь функционал моделей и можно обучить свою модель (LoRA).
Примеры изображений, сгенерированных с помощью моделей FLUX.1
Изображения, созданные с помощью FLUX.1, мягко говоря, впечатляют, и это еще мягко сказано.
У него большое и активное сообщество разработчиков и пользователей, которые помогают ему становиться все лучше. Его открытый исходный код позволяет пользователям настраивать инструмент и добавлять новые функции.
Сейчас я покажу на нескольких примерах, насколько великолепны получаемые изображения.
Киборги занимают рабочие места людей
Промпт: Cyborgs taking the human jobs in the dystopian future.
Лично мне больше понравился дизайн киборга в Midjourney, но следование промпту более точно у FLUX.1 Pro. Midjourney славится точностью создания изображений, но FLUX.1 Pro работает еще лучше.
Селфи девушки на вечеринке
Промпт: Selfie, self-portrait of a woman at the party, candid, ultra-wide-angle, distinct facial features, neon lights, red, everyday outfit, 4k
Изображения, созданные всеми моделями, хороши, но давайте посмотрим, как они смотрятся в сравнении друг с другом. Lightning XL - это доработанная модель Leonardo AI, и она проделала довольно приличную работу, за исключением того, что на лице не видны красные неоновые огни.
Варианты использования сгенерированных изображений бесконечны, и в индустрии генераторов изображений наблюдается только тенденция к росту. Станет ли она миллиардной индустрией к 2030 году? Время покажет.
Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.