Comments 18
Вот поэтому я использую stable diffusion
Кстати, Kandinsky тоже в общем доступе на гитхабе. По-моему, картинки лучше получаются, чем на SD.
Ну я упрощаю. Используем не конкретно sd, а invokeai с кучей разных моделей. Просто если написать invoke ai - поймёт два с половиной человека. А что такое sd - всё знают
"Все знают" - слишком громко сказано.
Я был уверен, что более менее разбираюсь в современных IT трендах, но массовые посты последних месяцев показали, что я где-то свернул не туда, а мои знания нейросетей находятся на уровне однослойных нейросеток 20-летней давности ;(((
Подскажите, где найти подборку статей на тему нейросетей, чтобы осознать их текущие возможности и что-то позапускать у себя (в идеале в linux'е, в идеале чтоб ресурсов она требовала в пределах домашних компов, а не "800 ядер и 10 Тб оперативки")?
На 4chan в /g/ есть sdg (stable diffusion general), aicg(ai chat general), lmg(language model general) и прочие, в оп постах прикреплены ссылки на чайников разного уровня начиная от "как и какие модели запустить" до "как натренировать вайфу".
И так как там минимум цензуры, то мне, как мамкиному ресерчеру, нравится брать новости оттуда
За статьи не подскажу, не слежу тщательно. Да и в целом они устаревают быстрее чем публикуются.
По тексту гуглите: ChatGPT, gtp4all, vicuna, koala Все кроме ChatGPT можно локально запустить.
По изображения: InvokeAI я уже упоминал. Позволяет в пару кликов локально разворачивать окружение в котором работает большое количество разных моделей.
Всё это работает на винде и линуксе. Но требования к железу есть. Вы не обойдетесь древним ноутом на 4 гига оперативы. Часть сетей требует RTX видео карту, часть 120 гигов оперативы(gpt4all 30B например).
На слабом железе тоже всякое можно запустить, но и чуда не будет - будет медленно и с маленьким датасетом(а значит с низким качество выхода).
Вот про SD для начала: https://habr.com/ru/articles/709892/
Просто если написать invoke ai - поймёт два с половиной человека
Потому что все сидят на webui от автоматика ? https://github.com/AUTOMATIC1111/stable-diffusion-webui
Ну часть плагинов типа критовских использует автоматику как базу. Поэтому её популярность понятна.
А вот тех, кто использует автоматику с браузером я понять не могу, потому что invoke ai имеет как минимум веб интерфейс не хуже(на мой взгляд гораздо лучше, но возможно дело вкуса), при этом есть дополнительные возможности, которых нет в автоматике.
Впрочем, дело вкуса.
Kandinsky генерит на уровне развития нейронок полуторалетней давности или около того
А мне кажется наоборот на SD лучше
Sine tenebris non est lux
Негатив - понятие относительное и сильно растяжимое.
Все-таки все эти "повесточки", модные запреты и политическое цензурирование - это все должно идти в топку, когда речь идет о развитии технологий. Вот сделали этот MJ - пуст генерят все, что не противоречит уголовному кодексу. Но нет же, сначала парни сделали годный инструмент, а теперь его начинают прикручивать активисты разных движений, обиженные творчеством люди и пр... сейчас следом начнут подключаться BLM всякие, ЛГБТ и пр, которые непременно на что-то обидятся. Даже далеко идти не надо - забиваешь в строке "красивая девушка", и MJ тебе генерит тонны симпатичных белых девчонок. Ни тебе толстых, ни темнокожих, ни трансгендерных. Я ничего против не имею, но я против того, что бы влезали регулирующие органы, и диктовали как надо, а как не надо. А они ж придут обязательно ...
Ранние нейросети мы будем вспоминать с ностальгией, как времена вольницы раннего Интернета.
В Midjourney «запретят негатив»