Комментарии 16
Очень классно, спасибо!
Очень классно, спасибо!
Классная трёхрукая крольчиха, да.



Строчки в "газете" тоже восхитительны.
да там почти на каждом видео - вагон артефактов (отражения, неожиданные изменения формы, неестественные формы, нефизичное поведение и т.п.). Но видео воспринимается человеком намного менее критично чем статичная картинка (мозг не успевает в риалтайме придраться - не хватает вычислительных мощностей). Поэтом у в общем смотрится неполохо.
Астрологи уже давно объявили год фейковых и полуфейковых видео на всяких тиктоках и шортсах.
https://habr.com/ru/companies/first/articles/701396/comments/#comment_24972478
До исполнения 6, 7 и прости боже, 8 пунктов прогноза осталось совсем немного. ;)
Помнится, годах эдак в 1980-х нам рассказывали, что бухгалтеры будут не нужны — их компьютеры заменят...
Фактически, так и получилось. Если раньше на каждом предприятии была бухгалтерия, то сейчас моя одногруппница - пошедшая по этому направлению, с напарницей ведут чуть больше 20 предприятий.
А про генерацию видео и музыки - уже результаты весьма и весьма ;)
https://youtu.be/-a9-Cy8nugE?t=105
Посмотрел. Не льстите себе — это не ИИ такой крутой, а слушатели такие лохи непритязательные.
Так извините, этой технологии еще и года нет. Если глянуть сейчас нейрокаверы, то прогресс заметен даже по сравнению с июльской ссылкой. Уже на некоторых композициях сложно понять - это человеки или моделька, палится компьютер в основном на произношении, слишком правильное ;)
https://habr.com/ru/companies/first/articles/701396/comments/#comment_24972478 - видимо, 6-ое предсказание сбудется даже быстрее, чем ожидалось ;-Р
видимо, 6-ое предсказание сбудется даже быстрее, чем ожидалось
Повторюсь ещё раз: это не ИИ такой крутой, а слушатели такие лохи непритязательные.
Вот когда оно мне споёт, ну, скажем, гимн Зимбабве с тем же чувством, с каким Марк Бернес спел "Журавли" — вот тогда и поговорим.
Я думаю на двойном слепом эксперименте вы ИИ каверы от реальных каверов не отличите. Человек звук обрабатывает значительно хуже чем зрение, так что слух легче обмануть.
Круто. Спасибо за список моделей.
Чем-то из приведенного в статье можно воспользоваться бесплатно или хотя бы просто воспользоваться без больших нюансов?
Вот немного повеселее пример для Runway Gen-3 Alpha плюс Runway LipSync. Сделано из Midjourney изображения с помощью нашего Runway API.
Нейросети для генерации видео: топ лучших сервисов