Новая open-source модель для генерации картинок от ByteDance с 14 миллиардами параметров. По производительности BitDance обогнала всех, включая Z-Image-Turbo, Z-Image, Seedream 3.0, GPT Image, Flux и там еще много других, почти обогнала Qwen-Image.

Компания улучшила токенизатор, теперь размер словаря составляет до 2^256 токенов, а коэффициент сжатия - 16x-32x. Значительно было улучшено качество реконструкции.

Завезли фичу с параллельной генерацией (Next-Patch Diffusion). Теперь модель предсказывает до 64 токенов одновременно вместо одного. Скорость генерации достигает 90+ изображений (256x256) в секунду, что быстрее в 37,7 раз лучших автогрессивных моделей.

Модель доступна в двух вариациях:

  • BitDance-14B-64x

  • BitDance-14B-16x

Есть на GitHub и Hugging Face.


Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник