Сейчас AGI идет в сторону конкурирующих мультимодальных агентов, для которых LLM один из инструментов. Но конечно всё это костыль на костыле и костылём погоняет.
Тем временем у меня на рабочем ПК с 16Гб памяти и 3060Ti спокойно работают Fooocus и Forge - оптимизация не стоит на месте. Да я не могу одновременно с генерацией запустить фотошоп или браузер с десятком вкладок, но это терпимо. В Fooocus потребление памяти примерно 10-12Гб и 6-8Гб видеопамяти всего.
Графика не новая, на старой архитектуре, небольшой буст ей придает быстрая DDR5. Ну и все эти 60fps в Cyberpunk на низких настройках с FSR, плавали, знаем...
Пара замечаний: я бы не называл 3070 мощной видеокартой, в текущих реалиях мощные карты это 4090\4080 и 7900XTX\XT а 3070 теперь скорее крепкий середнячок. И все данные по Киберпанку надо пересматривать, с выходом патча 2.0 требования к процессору и нагрузка выросли почти двухкратно.
Firefly генерирует изображение 1024х1024 и потом масштабирует его, никаких 6000х4000 вы от него не получите - будет мыло. По многим остальным пунктам тоже facepalm.jpg Например если вы видите что плагин делает по дефолту сильную растушевку маски - сделайте побольше охват или найдите где это настраивается, маску сделайте свою наконец. Плюс как всегда не используете нормально промты полноценные и негативные, например на генерации собачки у стейбла вполне адекватная картинка - поставлен в минус что нет травы, а где она в промте? И т.д.
Просто этот рендер кидал в дискорд - что бы не встраивать огромный файл дал ссылку, а так и животных рендерю и ландшафты и много чего еще. Про пьющих кофе людей можно не обучать отдельно, SD прекрасно понимает контекст, если будет криво то инпеинтом поправить не составляет труда, а запущенные случаи инпеинт скетч. Я понимаю что нужно время разобраться в инструменте, что бы получать отличные рендеры именно того что вам хотелось, но и поверхностные обзоры генеративных сеток в стиле "я закинул промт "рыжий кот" во все сетки и что из этого вышло" тоже уже начинают подбешивать, их на этом ресурсе уже очень много. У вас обзор вышел более подробным, но субъективные оценки немного портят впечатление, например у SD в запрещенке 3 балла - хотя там вообще нет цензуры, и такие же 3 балла у зацензуренной во все поля Mj.
Интерфейсы это хорошо, в Automatic1111 уже давно были фичи которых нет у конкурентов, но внедрение ControlNet и особенно версии 1.1 позволило очень мощно управлять генерацией и выполнять еще много функций. Плюс огромное количество чекпоинтов, эмбеддингов, LoRA и возможность тренировать свои - это все дает повышение качества в итоге и позволяет получить именно то что хочется а не рандомный результат. А апскейл всегда лучше сделать той же моделью которой и делалсь генерация, что бы не отличался стиль.
Очень поверхностно. Я понимаю что всей глубины и тонкостей работы с SD очень сложно осознать, но важно было донести что у всех остальных сеток возможностей больше того что вы описали почти нет, им выше уже не прыгнуть, а SD может по качеству уже сейчас выдавать приличные вещи, а если вникнуть в процесс то уже можно выдавать просто космическое качество. Например тот же апскейл через ControlNet Tiles может вам без артефактов сделать 4К+ картинку с высочайшей нативной детализацией, чего другие сетки пока не могут.
По пунктам: 1) Ноутбуки с той же мобильной 3050 это уже самый верх офисного сегмента и доступны при грамотном выборе каждому. А игровые решения за чуть большие деньги запустят без проблем. 2) Плохо представляю как такая женщина работающая в общепите раньше пользовалась Midjourney через дискорд и имеет страницу в соцсети с AI артами. Скорее эта женщина найдет для себя бесплатные playgroundai или lexica где можно копипастить промты и делать ремиксы. 3) Согласен, вникнуть во все возможности Automatic111 сможет не каждый, но ведь для создания картинки с базовой моделью нужна лишь строка промта - она работает "из коробки" а уже постепенно потом изучать функционал, покачать модели, посмотреть пару видео на ютубе про настройки может каждый.
На RTX 2070 с 8Гб в Automatic111 + xformers прекрасно рендерю картинки выше чем 1024х1024 а еще есть скрипт Ultimate SD Upscale где тайлами можно хоть до 2К\4К повышать детализацию. Плюс имею полный инструментарий для работы: img2img, inpainting, ControlNet, апскейлинг с codeformer различные модели, эмбеддинги и т.д.
Очень симпатично получается, особенно если всё выкрутить на максимум, даже несмотря на шум. RTX карта загудела кулерами он нагрузки, выдавая порядка 100fps на максимальных настройках FullHD.
Сейчас AGI идет в сторону конкурирующих мультимодальных агентов, для которых LLM один из инструментов. Но конечно всё это костыль на костыле и костылём погоняет.
Тем временем у меня на рабочем ПК с 16Гб памяти и 3060Ti спокойно работают Fooocus и Forge - оптимизация не стоит на месте.
Да я не могу одновременно с генерацией запустить фотошоп или браузер с десятком вкладок, но это терпимо. В Fooocus потребление памяти примерно 10-12Гб и 6-8Гб видеопамяти всего.
В целом нормально, тем более моддеры переделывают DLSS FG на FSR FG в тех играх где он есть - и это продлит вашей карте жизнь.
Для задач рендера или AI объединять карты через NVlink не нужно, а для игр технология уже мертва около 5 лет.
Ну миник это не "нормальный компьютер" увы, а в ноутбуке еще и экран и батарея и прочие плюшки. А стоит почти так же.
Жаль конечно что эти миники стоят как крыло от боинга - с RX780М на DDR5 хотелось бы, но там ценник улетает к 1000$ уже...
Графика не новая, на старой архитектуре, небольшой буст ей придает быстрая DDR5.
Ну и все эти 60fps в Cyberpunk на низких настройках с FSR, плавали, знаем...
В принципе нормально расписали, только вот нет рекомендаций по разрешению рендера, особенно в связке с HiresFix.
Пара замечаний: я бы не называл 3070 мощной видеокартой, в текущих реалиях мощные карты это 4090\4080 и 7900XTX\XT а 3070 теперь скорее крепкий середнячок. И все данные по Киберпанку надо пересматривать, с выходом патча 2.0 требования к процессору и нагрузка выросли почти двухкратно.
Посмотрел на свой ПК с 13600KF и 4080 с подозрением...
Firefly генерирует изображение 1024х1024 и потом масштабирует его, никаких 6000х4000 вы от него не получите - будет мыло. По многим остальным пунктам тоже facepalm.jpg
Например если вы видите что плагин делает по дефолту сильную растушевку маски - сделайте побольше охват или найдите где это настраивается, маску сделайте свою наконец. Плюс как всегда не используете нормально промты полноценные и негативные, например на генерации собачки у стейбла вполне адекватная картинка - поставлен в минус что нет травы, а где она в промте? И т.д.
Новая 2.1 да, только ей почти никто не пользуется, а версия 1.5 на которой 99% всех кастомных моделей и LoRA основано не зацензурена совсем.
Просто этот рендер кидал в дискорд - что бы не встраивать огромный файл дал ссылку, а так и животных рендерю и ландшафты и много чего еще. Про пьющих кофе людей можно не обучать отдельно, SD прекрасно понимает контекст, если будет криво то инпеинтом поправить не составляет труда, а запущенные случаи инпеинт скетч.
Я понимаю что нужно время разобраться в инструменте, что бы получать отличные рендеры именно того что вам хотелось, но и поверхностные обзоры генеративных сеток в стиле "я закинул промт "рыжий кот" во все сетки и что из этого вышло" тоже уже начинают подбешивать, их на этом ресурсе уже очень много. У вас обзор вышел более подробным, но субъективные оценки немного портят впечатление, например у SD в запрещенке 3 балла - хотя там вообще нет цензуры, и такие же 3 балла у зацензуренной во все поля Mj.
Меня больше фотореализм пока привлекает, с этим проблем нет, уже можно делать.
Вот например мой рендер с апскейлом через контрол нет, тут конечно есть что подправить в фш, это чистый рендер из SD подкрутил только в CameraRAW по цвету слегка.
https://cdn.discordapp.com/attachments/752489365967601664/1104359707969343594/01066-3758308780.jpg
Интерфейсы это хорошо, в Automatic1111 уже давно были фичи которых нет у конкурентов, но внедрение ControlNet и особенно версии 1.1 позволило очень мощно управлять генерацией и выполнять еще много функций.
Плюс огромное количество чекпоинтов, эмбеддингов, LoRA и возможность тренировать свои - это все дает повышение качества в итоге и позволяет получить именно то что хочется а не рандомный результат.
А апскейл всегда лучше сделать той же моделью которой и делалсь генерация, что бы не отличался стиль.
Очень поверхностно. Я понимаю что всей глубины и тонкостей работы с SD очень сложно осознать, но важно было донести что у всех остальных сеток возможностей больше того что вы описали почти нет, им выше уже не прыгнуть, а SD может по качеству уже сейчас выдавать приличные вещи, а если вникнуть в процесс то уже можно выдавать просто космическое качество. Например тот же апскейл через ControlNet Tiles может вам без артефактов сделать 4К+ картинку с высочайшей нативной детализацией, чего другие сетки пока не могут.
По пунктам:
1) Ноутбуки с той же мобильной 3050 это уже самый верх офисного сегмента и доступны при грамотном выборе каждому. А игровые решения за чуть большие деньги запустят без проблем.
2) Плохо представляю как такая женщина работающая в общепите раньше пользовалась Midjourney через дискорд и имеет страницу в соцсети с AI артами. Скорее эта женщина найдет для себя бесплатные playgroundai или lexica где можно копипастить промты и делать ремиксы.
3) Согласен, вникнуть во все возможности Automatic111 сможет не каждый, но ведь для создания картинки с базовой моделью нужна лишь строка промта - она работает "из коробки" а уже постепенно потом изучать функционал, покачать модели, посмотреть пару видео на ютубе про настройки может каждый.
Это вы еще на хвост со смещением не обратили внимание )
На RTX 2070 с 8Гб в Automatic111 + xformers прекрасно рендерю картинки выше чем 1024х1024 а еще есть скрипт Ultimate SD Upscale где тайлами можно хоть до 2К\4К повышать детализацию.
Плюс имею полный инструментарий для работы: img2img, inpainting, ControlNet, апскейлинг с codeformer различные модели, эмбеддинги и т.д.