Мое знакомство с диффузионными нейросетями началось недавно. Вообще я режиссер-документалист и сейчас снимаю фильм о музыке коренных народах Сибири.
Обычно, после съемок в фильме остаются огромные пробелы, которые по традиции закрываются архивными фото и видео. Но, когда на дворе век AI революции, а картинки в нейросетях рисуют даже домохозяйки, появилась идея воспользоваться возможностями машинного обучения и сгенерировать для фильма множество коренного Сибирского арта.
Однако, не все так просто. Перепробовав множество популярных сервисов, все как один вместо Алтайцев, Хакасов или Тувинцев рисовали что-то среднее между Индейцем и Монголом. Поэтому я плавно стал осваивать Stable Diffusion, в надежде когда-то создать и обучить свою модель по нужной мне тематике.
И тут выходит Kandinsky 2.1. Услышав о нем, первый делом попробовал запрос «Тувинский музыкант» и о чудо, результат получился наиболее аутентичным из всех.