Comments 4
Еще пальцы толком не научились рисовать а уже на видео замахиваются)
Тут не всё так однозначно. Требование к консистентности объектов при их движении на видео приводит к тому, что объекты на каждом отдельном кадре становятся более правдоподобными, чем если бы сеть училась на статических картинках. В воздухе давно витает идея, что нейросети для обработки и анализа изображений нужно тренировать на коротких отрезках видео, а не на фотографиях. Просто пока ресурсы не позволяют.
Люди, например, в основном учатся на «видео».
Да нейронка без проблем сделает перетекание из "бреда" в "бред". Без понимания трехмерного мира толку не будет, имхо. Посмотрите насколько плохо сейчас дело обстоит https://www.youtube.com/watch?v=njTplZt9pAM
Даже на тысячной самой удачной итерации - опытный хирург на таких руках заметит перелом или артроз)
вместе с такой технологией приходит и ответственность, поскольку авторы моделей признают возможность злоупотреблений и наличие предубеждений в обучающих данных
Эти технологии ещё даже потыкать нельзя. Тот случай, когда ответственность пришла раньше технологии
Нейросети в генерации видео: Imagen video и Phenaki