
ByteDance выпустила Seedream 4.5 — новую версию модели генерации и редактирования изображений. Предыдущая Seedream 4.0, в сентябре возглавила оба лидерборда аналитической платформы Artificial Analysis (Text-to-Image и Image Editing Arena) с рейтингом ELO 1205, обойдя Google Gemini 2.5 Flash Image, более известный как Nano Banana (ELO 1201). Обновление вышло спустя три месяца после релиза 4.0 — агрессивный темп для рынка, где конкуренты вроде Midjourney обновляют свои модели значительно реже.
Ключевые улучшения версии 4.5 касаются скорости, консистентности и работы с текстом. По данным партнерских платформ, генерация стала на 30% быстрее, чем в 4.0. Модель теперь поддерживает до 15 референсных изображений одновременно (ранее — 10), что позволяет точнее контролировать стиль, персонажей и объекты при создании серий. Разработчики также заявляют об улучшенном рендеринге типографики: текст на постерах, упаковке и в интерфейсах должен оставаться читаемым даже в сложных композициях — проблема, с которой до сих пор борются многие генераторы.
Среди других заявленных улучшений — более стабильная консистентность персонажей между кадрами (лица, одежда, материалы), улучшенное понимание пространственной логики (пропорции, перспектива, глубина сцены) и поддержка вывода в разрешении до 4K. Архитектурно Seedream 4.5, как и предшественница, построена на Diffusion Transformer (DiT) с высокоэффективным VAE-энкодером, что обеспечивает быструю генерацию при сохранении качества.

По данным внутреннего бенчмарка MagicBench, Seedream 4.5 демонстрирует значительное улучшение относительно версии 4.0 по трем ключевым метрикам: следование инструкциям (prompt adherence), согласованность с референсами (alignment) и эстетическое качество (aesthetics). Конкретные числовые показатели ByteDance не раскрыла, но опубликовала сравнительные радарные диаграммы — с учетом того, что четвертая версия обходила Nano Banana, можно говорить, что в лице 4.5 перед нами конкурент Nano Banana Pro.
Модель уже доступна через партнерские платформы: Replicate (в статусе бета), Pixazo, Atlas Cloud и другие. Стоимость генерации — $0.04 за изображение (Seedream 4.0 стоила $0.03).
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
