Как стать автором
Обновить

Разработчики представили нейросеть для анимации фотографий

Время на прочтение1 мин
Количество просмотров11K

Исследователи выпустили модель машинного обучения MagicAnimate, предназначенную для анимации фотографий. В исследовании отмечается, что нейросеть справляется с задачей лучше похожих решений.

Для генерации используется эталонное изображение и последовательность кадров движения в виде анимации DensePose. После этого применяется диффузионная модель для генерации кадров с учётом содержимого эталонного изображения. Полученные кадры склеиваются в готовый ролик.

Разработчики отмечают, что для генерации анимаций в полный рост нейросети не надо передавать эталонную фотографию с персонажем в полный рост. Все недостающие элементы дорисует диффузионная модель, а пользователь может указать уточняющий запрос для генерации. В одном из примеров использовали картину «Мона Лиза» для создания анимации бега.

В экспериментах проверили возможность анимации изображений, полученных с помощью DALL-E 3. Нейросеть справилась с заданием. Это даёт возможность наладить полный процесс производства анимированных кадров несуществующих персонажей.

Также учёные отметили, что MagicAnimate поддерживает генерацию анимаций для нескольких человек в кадре. Для этого важно, чтобы на эталонном изображении и кадрах DensePose совпадало количество людей.

Код проекта открыт и опубликован на GitHub, а протестировать возможности MagicAnimate можно на платформе Hugging Face.

Теги:
Хабы:
Если эта публикация вас вдохновила и вы хотите поддержать автора — не стесняйтесь нажать на кнопку
Всего голосов 9: ↑8 и ↓1+13
Комментарии3

Другие новости

Работа

Data Scientist
81 вакансия

Ближайшие события

14 июля
Фестиваль Selectel Day Off
Санкт-ПетербургОнлайн
19 сентября
CDI Conf 2024
Москва
24 сентября
Конференция Fin.Bot 2024
МоскваОнлайн