Как стать автором
Обновить

Omost — новый веб-интерфейс от создателя Controlnet, Fooocus и Forge: возможности и примеры

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров5.5K
Всего голосов 9: ↑8 и ↓1+8
Комментарии10

Комментарии 10

До этого использовал несколько сред ИИ для генерации изображений. Всех ставил в тупик запрос нарисовать самолет с 8 двигателями. Справится ли Omost?

Не похоже. Если даже тут у него есть 6 пальцев.

Бинг справляется. Но штука необычная надо несколько попыток сделать.

У

У большинства вариантов 6 получается

SDXL

Да, отличный результат!

Вопрос - можно ли подключить в Omost стороннюю LLM по OpenAI API? Потому что делать генерацию текстов на локальной машине это обычно медленно, и хорошие модели в память не влезают.

Такой возможности нет, плюс встроенные LLM модели там специально до обученные чтобы хорошо работать именно с генерацией.

Как-то странно оно работает. На запрос "hybrid of human and Godzilla. Godzilla with a human head" выдает такую картинку. Хотя в тексте, который генерирует программа указано, что "'The human head is attached to Godzilla’s body, creating a surreal and unique hybrid.'," и еще в нескольких местах встречается вполне правильное описание. Аналогично ничего не вышло с тем, чтобы один человек сидел на коленях у другого. В описании четко сказано во что они одеты. В итоге один сидит на стуле, второй стоит сзади. И ни один из них не одет в шорты и футболку, как заказывал.

у Годзиллы хотя бы пальцы более-менее нормальные. у с генерированного человека вместо пальцев "традиционная" каша

У кого-то получилось добавить, удалить или исправить хотя бы одну из множества генерируемых canvas.add_local_description() функций?

Мне в своё время так и не удалось в Foocus сгенерировать лицо девушки с тонкими бровями, ключевые слова игнорирует, вес тоже :(
Не подскажите, здесь с этим получше?

По сравнению с Flux - Omost лучше или нет?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации