Search
Write a publication
Pull to refresh
-4
0
Send message

Нейросети для локальной генерации видео

Level of difficultyMedium
Reading time3 min
Views9.7K

Давно было понятно, что генерация видео с помощью нейросетей станет возможной локально на ПК. Это полезно для всех, кто не готов платить за подписки, но готов платить за мощное железо. Потому что видео-модели требуют значительных вычислительных ресурсов.

На текущий момент существует несколько ключевых моделей, которые подходят для локальной установки: stable Video Diffusion, Mochi 1, Hunyan Video и LTX Video. Каждая из них имеет свои уникальные особенности, которых ниже.

Stable Video Diffusion (SVD)

Эта модель, разработанная Stability AI, является одной из первых открытых моделей для генерации видео из изображений. Она основана на латентных диффузионных моделях и может генерировать короткие клипы с высоким разрешением. Согласно данным, SVD доступна на платформе Hugging Face, и пользователи могут запускать ее локально с помощью фреймворка Diffusers. Для эффективной работы требуется NVIDIA GPU с минимум 16 ГБ VRAM, что делает ее довольно ресурсоемкой.

Mochi 1

Модель разработанная Genmo AI, специализируется на генерации видео из текстовых подсказок. Она открыта под лицензией Apache 2.0, что позволяет скачивать код и веса модели с GitHub. Модель поддерживает разрешение 480p с частотой 30 кадров в секунду и может генерировать видео длительностью до 5,4 секунды. Точные требования к оборудованию не указаны, но предполагается, что требуется мощный GPU.

Hunyan Video

Эта модель от Tencent выделяется своими 13 миллиардами параметров, что делает ее одной из самых крупных открытых моделей для генерации видео. Код и веса модели доступны на GitHub. Она поддерживает разрешения до 720p x 1280p и требует минимум 45 ГБ GPU-памяти для базового разрешения, с рекомендацией 80 ГБ для оптимальной производительности.

Читать далее

Сравнение Apple Vision Pro и Meta Quest 3

Level of difficultyEasy
Reading time6 min
Views9.8K

Технологии AR и VR по-моему недооцененная технология, хайп на которую исчез довольно быстро. Оно и понятно, объективно, технология дико сырая, но обо всем по порядку. Сейчас на рынке есть два стула - это Apple Vision Pro и Meta* Quest 3.

В феврале 2024 года Apple, представила миру Vision Pro, которая скорее AR-гарнитура. Стоимость этого хм... добра $3500. Маркетологи назвали ее новой парадигмой «пространственных вычислений».

В октябре 2023 года вышла VR-гарнитура — Meta* Quest 3 стоимостью около $500. Это уже третья версия шлема, которая единолично главенствовала на рынке до выхода Vision Pro.

Объективно, шлем может стать хорошим подспорьем для людей творческих профессий, дизайнеров, создателей 3D-объектов, архитекторов. Если ваша карьера связана с визуалом, стоит рассмотреть приобретение одного из устройств чтобы быть на волне индустрии и опережать коллег по цеху. Для этого хотелось бы сравнить обе технологии и понять что выбрать.

Читать далее

Information

Rating
Does not participate
Registered
Activity

Specialization

Marketing Manager, Marketing Analyst