Как стать автором
Обновить

Тестируем нейросети для генерации изображений

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров48K
Всего голосов 24: ↑19 и ↓5+20
Комментарии16

Комментарии 16

Абзац про StableDiffusion, вы очевидно писали в прошлом августе, когда сеть вышла и действительно рисовала так.

a realistic photo of a Texas farmer holding a bushel of apples, in the apple orchard, at noon

Ничего не редактировал и почти не выбирал - это вторая картинка. Остальной текст тоже суть повторение слухов за прошлый год и рекламы. Писали бы о том, в чём разбираетесь, что ли....

вот промт по вашим словам в этой сети, вообще все не очень получилось
вот промт по вашим словам в этой сети, вообще все не очень получилось

А версия модели какая?

Stable Diffusion 2.1 Demo, переходил по ссылке из статьи

Пока минус только в том, что изображения на узкоспециализированную тематику получаются пока не очень... просто не хватает данных для генерации.

Гораздо интересней тестировать на том что в жизни (и других картинках из набора обучения) не встречается. Например, "собака верхом на коте", "лошадь верхом на собаке" и т.д. - несмотря на то что изредка, поработав над промптом, можно получить некое приближение к этому, но в массе своей сети глючат и выдают совсем не то.

Котики у Кандинского не совсем натуральные...

Я так понял, лицо Вас не смущает...

кстати котики у Кандинского еще получаются более менее если добавить волшебное слово "красивый" а вот с людьми пока не очень...

Интересный конкурент Midjourney - picfinder.ai, еще в начале апреля демонстрировавший посредственные результаты, но интересный тем, что выдавал неограниченное количество вариантов по каждому запросу - что-нибудь да подойдет; буквально на днях совершил резкий скачок в качестве и тут же стал платным. Пока что тариф щадящий - напр. 5$ сутки при всё том же бесчисленном количестве генераций. Язык - английский, есть imgtoimg.

НЛО прилетело и опубликовало эту надпись здесь

Удаляете куки и работаете дальше

Можно оплатить через сервис pyypl.com.

Странная реклама странного "финансового" сервиса.

почему в опросе нет варианта "инструмент делающий работу эффективнее"?

Меня бомбит с таких тестов. От иных лонгов на дтф толку больше.

Во-первых, dall-e mini был переименован в crAIyon и на сайте ai в названии выделено жёлтым, чтобы никто случайно не написал crayon.
Во-вторых, судить по двум промптам - это не тест. Это даже первыми впечатлениями назвать сложно.
В третьих. Про sd много что не сказано. Где упоминание орды? Подумаешь доступ к десятку моделей sd бесплатно без смс и регистрации. Где a1111 с его форками и самплерами и плагинами и инструментами, где ComfyUI с его нодами? Где плагины к крите, блендеру, годоту, ue5?

Я понимаю если бы часть не была названа, но когда вместо всего этого использовали "Также есть приложения на основе Stable Diffusion." то как-то выглядит неправильно

Если это всё не сказано про sd, если craiyon даже не назван правильно, то доверия к анализу всего другого тоже нет.
Я уж не говорю про то что у sd несколько моделей и что у crAIyon несколько моделей (я до сих пор использую первую, ламповую)

Midjourney относится к классу диффузионных нейронных сетей, то есть состоит как бы из двух нейросетей: одна отвечает за распознавание текста, другая — за генерацию изображений.

Диффузионные сети так называются не поэтому, а из-за самого процесса генерации картинки.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий