Боди-хоррор от новой версии Stable Diffusion
На этой неделе компания Stability AI выпустила новую модель синтеза изображений Stable Diffusion 3 Medium, способную преобразовывать текстовые подсказки в изображения. Однако релиз встретил волну критики в интернете. Пользователи отмечают, что качество изображений людей, созданных данной моделью, значительно уступает Midjourney и DALL-E 3.
Особенно это касается изображений рук и ног, которые выглядят по-настоящему трэшово (что, в целом, является стандартной проблемой) :/
Основной причиной провала считается строгая фильтрация взрослого контента (NSFW) из обучающих данных, что привело к недообучению модели в части человеческой анатомии.
Проблемы с рендерингом людей не новы для Stability AI. В прошлом аналогичные трудности возникали с выпуском Stable Diffusion 2.0. Несмотря на улучшения в SD 2.1 и SD XL, текущие шаги компании вновь вызывают вопросы.
Неудачи с SD3 Medium также совпали с внутренними проблемами компании. Недавно Stability AI покинул основатель и генеральный директор Эмад Мостак, за чем последовали увольнения ключевых инженеров и слухи о финансовых трудностях.
Для поклонников Stable Diffusion это не просто технический сбой, а тревожный сигнал о возможных глубинных проблемах в управлении компанией.