GLM-Image выложили в открытый доступ. Хороший китайский, транслит вместо кириллицы / Хабр

Китайские товарищи из Zhipu AI выложили модель для генерации картинок GLM-Image (text-to-image и image-to-image) в открытый доступ.

В свой главный сайт z.ai, почему-то сразу не втащили, ещё и старую модель отключили, пока там генерируются только вызовы функции. Но там зато можно бесплатно общаться с их GLM моделью, по качеству довольно неплохая.

Потыкал модель на fal.ai (крупный провайдер моделей, доступ там платный, раньше при регистрации давали немного кредитов, сейчас не уверен). Сразу бросается в глаза, что сильно прокачали надписи на китайском. Никакие палочки в символах не слипаются; это сколько надо было втащить картинок с иероглифами в обучение.

Жалко, что кириллицу в обучение не добавляли, в нее модель вообще не умеет, пытается что-то написать транслитом.

Культурный контекст, видимо, тоже китайский в основном (поэтому на футболистах в качестве трационных головных уборов какая-то дичь), максимум рисует матрёшек.

Заявляют, что отлично работает как редактор изображений и для генерации коммерческих промо-картинок. По API доступна и веса в открытом доступе, поэтому, думаю, своего пользователя найдет.

Ссылки

HF: https://huggingface.co/zai-org/GLM-Image
GitHub: https://github.com/zai-org/GLM-Image
Документация к API https://docs.z.ai/guides/image/glm-image

Градиент обреченный — мой личный канал. Я работаю в сфере машинного обучения, делаю пет-проекты и изучаю языки. Буду рад вашей подписке.

GLM-Image выложили в открытый доступ. Хороший китайский, транслит вместо кириллицы

Другие новости

Ближайшие события