Тем временем у меня на рабочем ПК с 16Гб памяти и 3060Ti спокойно работают Fooocus и Forge - оптимизация не стоит на месте. Да я не могу одновременно с генерацией запустить фотошоп или браузер с десятком вкладок, но это терпимо. В Fooocus потребление памяти примерно 10-12Гб и 6-8Гб видеопамяти всего.
Графика не новая, на старой архитектуре, небольшой буст ей придает быстрая DDR5. Ну и все эти 60fps в Cyberpunk на низких настройках с FSR, плавали, знаем...
Пара замечаний: я бы не называл 3070 мощной видеокартой, в текущих реалиях мощные карты это 4090\4080 и 7900XTX\XT а 3070 теперь скорее крепкий середнячок. И все данные по Киберпанку надо пересматривать, с выходом патча 2.0 требования к процессору и нагрузка выросли почти двухкратно.
Firefly генерирует изображение 1024х1024 и потом масштабирует его, никаких 6000х4000 вы от него не получите - будет мыло. По многим остальным пунктам тоже facepalm.jpg Например если вы видите что плагин делает по дефолту сильную растушевку маски - сделайте побольше охват или найдите где это настраивается, маску сделайте свою наконец. Плюс как всегда не используете нормально промты полноценные и негативные, например на генерации собачки у стейбла вполне адекватная картинка - поставлен в минус что нет травы, а где она в промте? И т.д.
Просто этот рендер кидал в дискорд - что бы не встраивать огромный файл дал ссылку, а так и животных рендерю и ландшафты и много чего еще. Про пьющих кофе людей можно не обучать отдельно, SD прекрасно понимает контекст, если будет криво то инпеинтом поправить не составляет труда, а запущенные случаи инпеинт скетч. Я понимаю что нужно время разобраться в инструменте, что бы получать отличные рендеры именно того что вам хотелось, но и поверхностные обзоры генеративных сеток в стиле "я закинул промт "рыжий кот" во все сетки и что из этого вышло" тоже уже начинают подбешивать, их на этом ресурсе уже очень много. У вас обзор вышел более подробным, но субъективные оценки немного портят впечатление, например у SD в запрещенке 3 балла - хотя там вообще нет цензуры, и такие же 3 балла у зацензуренной во все поля Mj.
Интерфейсы это хорошо, в Automatic1111 уже давно были фичи которых нет у конкурентов, но внедрение ControlNet и особенно версии 1.1 позволило очень мощно управлять генерацией и выполнять еще много функций. Плюс огромное количество чекпоинтов, эмбеддингов, LoRA и возможность тренировать свои - это все дает повышение качества в итоге и позволяет получить именно то что хочется а не рандомный результат. А апскейл всегда лучше сделать той же моделью которой и делалсь генерация, что бы не отличался стиль.
Очень поверхностно. Я понимаю что всей глубины и тонкостей работы с SD очень сложно осознать, но важно было донести что у всех остальных сеток возможностей больше того что вы описали почти нет, им выше уже не прыгнуть, а SD может по качеству уже сейчас выдавать приличные вещи, а если вникнуть в процесс то уже можно выдавать просто космическое качество. Например тот же апскейл через ControlNet Tiles может вам без артефактов сделать 4К+ картинку с высочайшей нативной детализацией, чего другие сетки пока не могут.
По пунктам: 1) Ноутбуки с той же мобильной 3050 это уже самый верх офисного сегмента и доступны при грамотном выборе каждому. А игровые решения за чуть большие деньги запустят без проблем. 2) Плохо представляю как такая женщина работающая в общепите раньше пользовалась Midjourney через дискорд и имеет страницу в соцсети с AI артами. Скорее эта женщина найдет для себя бесплатные playgroundai или lexica где можно копипастить промты и делать ремиксы. 3) Согласен, вникнуть во все возможности Automatic111 сможет не каждый, но ведь для создания картинки с базовой моделью нужна лишь строка промта - она работает "из коробки" а уже постепенно потом изучать функционал, покачать модели, посмотреть пару видео на ютубе про настройки может каждый.
На RTX 2070 с 8Гб в Automatic111 + xformers прекрасно рендерю картинки выше чем 1024х1024 а еще есть скрипт Ultimate SD Upscale где тайлами можно хоть до 2К\4К повышать детализацию. Плюс имею полный инструментарий для работы: img2img, inpainting, ControlNet, апскейлинг с codeformer различные модели, эмбеддинги и т.д.
Очень симпатично получается, особенно если всё выкрутить на максимум, даже несмотря на шум. RTX карта загудела кулерами он нагрузки, выдавая порядка 100fps на максимальных настройках FullHD.
Немного не понял смысла данных роликов с музыкой, да — эффект работает, ощущение вращающейся вокруг тебя моно колонки четкое, но кроме как для демонстрации технологии не годится ни для чего — не будешь же так музыку слушать.
Тем временем у меня на рабочем ПК с 16Гб памяти и 3060Ti спокойно работают Fooocus и Forge - оптимизация не стоит на месте.
Да я не могу одновременно с генерацией запустить фотошоп или браузер с десятком вкладок, но это терпимо. В Fooocus потребление памяти примерно 10-12Гб и 6-8Гб видеопамяти всего.
В целом нормально, тем более моддеры переделывают DLSS FG на FSR FG в тех играх где он есть - и это продлит вашей карте жизнь.
Для задач рендера или AI объединять карты через NVlink не нужно, а для игр технология уже мертва около 5 лет.
Ну миник это не "нормальный компьютер" увы, а в ноутбуке еще и экран и батарея и прочие плюшки. А стоит почти так же.
Жаль конечно что эти миники стоят как крыло от боинга - с RX780М на DDR5 хотелось бы, но там ценник улетает к 1000$ уже...
Графика не новая, на старой архитектуре, небольшой буст ей придает быстрая DDR5.
Ну и все эти 60fps в Cyberpunk на низких настройках с FSR, плавали, знаем...
В принципе нормально расписали, только вот нет рекомендаций по разрешению рендера, особенно в связке с HiresFix.
Пара замечаний: я бы не называл 3070 мощной видеокартой, в текущих реалиях мощные карты это 4090\4080 и 7900XTX\XT а 3070 теперь скорее крепкий середнячок. И все данные по Киберпанку надо пересматривать, с выходом патча 2.0 требования к процессору и нагрузка выросли почти двухкратно.
Посмотрел на свой ПК с 13600KF и 4080 с подозрением...
Firefly генерирует изображение 1024х1024 и потом масштабирует его, никаких 6000х4000 вы от него не получите - будет мыло. По многим остальным пунктам тоже facepalm.jpg
Например если вы видите что плагин делает по дефолту сильную растушевку маски - сделайте побольше охват или найдите где это настраивается, маску сделайте свою наконец. Плюс как всегда не используете нормально промты полноценные и негативные, например на генерации собачки у стейбла вполне адекватная картинка - поставлен в минус что нет травы, а где она в промте? И т.д.
Новая 2.1 да, только ей почти никто не пользуется, а версия 1.5 на которой 99% всех кастомных моделей и LoRA основано не зацензурена совсем.
Просто этот рендер кидал в дискорд - что бы не встраивать огромный файл дал ссылку, а так и животных рендерю и ландшафты и много чего еще. Про пьющих кофе людей можно не обучать отдельно, SD прекрасно понимает контекст, если будет криво то инпеинтом поправить не составляет труда, а запущенные случаи инпеинт скетч.
Я понимаю что нужно время разобраться в инструменте, что бы получать отличные рендеры именно того что вам хотелось, но и поверхностные обзоры генеративных сеток в стиле "я закинул промт "рыжий кот" во все сетки и что из этого вышло" тоже уже начинают подбешивать, их на этом ресурсе уже очень много. У вас обзор вышел более подробным, но субъективные оценки немного портят впечатление, например у SD в запрещенке 3 балла - хотя там вообще нет цензуры, и такие же 3 балла у зацензуренной во все поля Mj.
Меня больше фотореализм пока привлекает, с этим проблем нет, уже можно делать.
Вот например мой рендер с апскейлом через контрол нет, тут конечно есть что подправить в фш, это чистый рендер из SD подкрутил только в CameraRAW по цвету слегка.
https://cdn.discordapp.com/attachments/752489365967601664/1104359707969343594/01066-3758308780.jpg
Интерфейсы это хорошо, в Automatic1111 уже давно были фичи которых нет у конкурентов, но внедрение ControlNet и особенно версии 1.1 позволило очень мощно управлять генерацией и выполнять еще много функций.
Плюс огромное количество чекпоинтов, эмбеддингов, LoRA и возможность тренировать свои - это все дает повышение качества в итоге и позволяет получить именно то что хочется а не рандомный результат.
А апскейл всегда лучше сделать той же моделью которой и делалсь генерация, что бы не отличался стиль.
Очень поверхностно. Я понимаю что всей глубины и тонкостей работы с SD очень сложно осознать, но важно было донести что у всех остальных сеток возможностей больше того что вы описали почти нет, им выше уже не прыгнуть, а SD может по качеству уже сейчас выдавать приличные вещи, а если вникнуть в процесс то уже можно выдавать просто космическое качество. Например тот же апскейл через ControlNet Tiles может вам без артефактов сделать 4К+ картинку с высочайшей нативной детализацией, чего другие сетки пока не могут.
По пунктам:
1) Ноутбуки с той же мобильной 3050 это уже самый верх офисного сегмента и доступны при грамотном выборе каждому. А игровые решения за чуть большие деньги запустят без проблем.
2) Плохо представляю как такая женщина работающая в общепите раньше пользовалась Midjourney через дискорд и имеет страницу в соцсети с AI артами. Скорее эта женщина найдет для себя бесплатные playgroundai или lexica где можно копипастить промты и делать ремиксы.
3) Согласен, вникнуть во все возможности Automatic111 сможет не каждый, но ведь для создания картинки с базовой моделью нужна лишь строка промта - она работает "из коробки" а уже постепенно потом изучать функционал, покачать модели, посмотреть пару видео на ютубе про настройки может каждый.
Это вы еще на хвост со смещением не обратили внимание )
На RTX 2070 с 8Гб в Automatic111 + xformers прекрасно рендерю картинки выше чем 1024х1024 а еще есть скрипт Ultimate SD Upscale где тайлами можно хоть до 2К\4К повышать детализацию.
Плюс имею полный инструментарий для работы: img2img, inpainting, ControlNet, апскейлинг с codeformer различные модели, эмбеддинги и т.д.