Китайские товарищи из Zhipu AI выложили модель для генерации картинок GLM-Image (text-to-image и image-to-image) в открытый доступ.

В свой главный сайт z.ai, почему-то сразу не втащили, ещё и старую модель отключили, пока там генерируются только вызовы функции. Но там зато можно бесплатно общаться с их GLM моделью, по качеству довольно неплохая.

Потыкал модель на fal.ai (крупный провайдер моделей, доступ там платный, раньше при регистрации давали немного кредитов, сейчас не уверен). Сразу бросается в глаза, что сильно прокачали надписи на китайском. Никакие палочки в символах не слипаются; это сколько надо было втащить картинок с иероглифами в обучение.

Учимся читать по китайски
Учимся читать по китайски

Жалко, что кириллицу в обучение не добавляли, в нее модель вообще не умеет, пытается что-то написать транслитом.

LLCKA - Spartak 5:2
LLCKA - Spartak 5:2

Культурный контекст, видимо, тоже китайский в основном (поэтому на футболистах в качестве трационных головных уборов какая-то дичь), максимум рисует матрёшек.

Чебурашка 3
Чебурашка 3

Заявляют, что отлично работает как редактор изображений и для генерации коммерческих промо-картинок. По API доступна и веса в открытом доступе, поэтому, думаю, своего пользователя найдет.

Ссылки

Градиент обреченный — мой личный канал. Я работаю в сфере машинного обучения, делаю пет-проекты и изучаю языки. Буду рад вашей подписке.