Комментарии / Профиль Gugutse / Хабр

Дарья Бакшандаева@Gugutse

Lead Data Scientist

Большая версия ruDALL-E, или Как отличить Кандинского от Малевича

Gugutse 23 июн 2022 в 09:55

Спасибо за добрые слова :) Да, мы, безусловно, будем работать с диффузионками – это будет DALL-E-2-like или Imagen-like, но что-то подобное точно.

Большая версия ruDALL-E, или Как отличить Кандинского от Малевича

Gugutse 23 июн 2022 в 09:50

Да, планируется!

Большая версия ruDALL-E, или Как отличить Кандинского от Малевича

Gugutse 17 июн 2022 в 10:48

Да, text-to-3D определенно следующий шаг в развитии :) Тут, конечно, вопрос в том, что нужны качественные и разнообразные 3D-датасеты и эксперименты, позволяющие определить, какое архитектурное решение наиболее удачно. Возможно, вам будут интересны некоторые шаги в этом направлении: Dream Fields (NeRF + CLIP), AvatarCLIP (CLIP + NeuS).

Большая версия ruDALL-E, или Как отличить Кандинского от Малевича

Gugutse 17 июн 2022 в 10:03

Тут я могу только прокомментировать фразу: просто запускаете чужой готовый код на картинках, но с другими подписями, – кода оригинальной DALL-E нет в открытом доступе (деятельность OpenAI уже давно не соответствует её названию), так что код мы писали сами.

Большая версия ruDALL-E, или Как отличить Кандинского от Малевича

Gugutse 17 июн 2022 в 09:33

Да, в свободном доступе модели Kandinsky действительно сейчас нет. Зато есть файнтюн Malevich (Surrealist XL) – можете попробовать погенерить в колабе (вот здесь веса на hugging face). По поводу мощностей: для Kandinsky требуется A100 (ну или можно три V100 :)