Comments / Profile of Wladradchenko / Habr

Wladislav Radchenko @Wladradchenko

Senior Software Developer

Profile Publications 23Comments 89Bookmarks 1

Создание deepfake видео и синтез речи open-source проект Wunjo AI

Wladradchenko Aug 8 2023 at 17:07

Видео как установить Wunjo AI на Windows и настроить deepfake https://www.youtube.com/watch?v=2qIpJYhOL2U

Look

Создание deepfake видео и синтез речи open-source проект Wunjo AI

Wladradchenko Aug 8 2023 at 11:55

По виндовс, сейчас тестируется билд на эмуляторе вроде получилось повторить ошибку. Залил не достающие Python3 файлы, если получится, билд на виндос заработает и запишу видео.

Пробовали билд 1.3.1 или 1.3.2? Я залил изменения с фиксом face_alignment, там в библиотеке зачем то поменяли название переменной с 2_D на TWO_D в init, из-за этого может на брифкейс не пошло. Но с 1.3.2 необходимо перейти в директорию portable 'cd portable' и запустить 'briefcase dev'. Этого будет достаточно. briefcase build -> briefcase package, это уже чтобы билды делать.

Look

Создание deepfake видео и синтез речи open-source проект Wunjo AI

Wladradchenko Aug 8 2023 at 08:28

Точнее по ошибки в билдах для виндос:

Нет доступа для чтения моделей. Чтобы разрешить доступ icacls "%USERPROFILE%/.wunjo/deepfake/gfpgan/weights/*.pth" /grant:r "Users":(R,W)
Однако, в билдах под виндос дальше возникает проблема not module aifc, который должен входить в пакет python3.
Разбираем дальше, оказывается проблема not module aifc возникает, при чтение аудио файла библиотекой librosa==0.8.0 по строчке librosa.core.load.
Данная проблема ещё не решена для билдов на виндос, поэтому для виндос лучше запускать приложение через briefcase dev, чтобы использовать deepfake, для синтеза речи достаточно будет билда.

Look

Создание deepfake видео и синтез речи open-source проект Wunjo AI

Wladradchenko Aug 8 2023 at 05:40

В скором времени напишу ещё об одном оpen source проекте связанного с lofi музыкой, который делал для себя и он доступен

Look

Создание deepfake видео и синтез речи open-source проект Wunjo AI

Wladradchenko Aug 8 2023 at 05:33

Позже добавлю на страничку гитхаб проекта. На сборке виндос встречается проблема связанная с тем, что почему-то нет доступа к чтению модели из созданной папки .wunjo. Почему она появляется на модели только на виндос и только для дипфейка для меня загадка, самой винды у меня нет, а на эмуляторе ВМ не появляется проблемы, чтобы нормально отладить сборку для виндос.

Такой проблемы нет, например если запускать проект из Гитхаба в консоли. Так права почему-то есть на чтение модели.

Из-за того, что нет прав на чтение модели, программа выдаёт лицо не видно. Если ставить расширение https://github.com/wladradchenko/advanced.wunjo.wladradchenko.ru, в проект добавится консоль и сразу будет понятно, что проблема с чтением модели.

Попробуйте для виндос 11, сначало сделать pip install - requirements.txt, а потом briefcase dev. Подробнее по install в редми проекта.

Look

Создание deepfake видео и синтез речи open-source проект Wunjo AI

Wladradchenko Aug 8 2023 at 05:23

В скором времени, напишу статьи, как использовать параметры для дипфейк (повороты головы в разные оси, улучшение картинки лица) и как обучать модель на своём голосе или датасете полученного из нарезки видео с ютюба. Следите за статьями!

Look

Создание deepfake видео и синтез речи open-source проект Wunjo AI

Wladradchenko Aug 7 2023 at 22:24

Да. Можно использовать модель со своим голосом и даже на другом языке. В yaml файле модели, необходимо только указать, что пути до модели и какой язык. Образец можно увидеть в default моделях. Для TTS используется Tacotron2, следовательно подходят все модели, котоыре были обучены в Tacotron2.

Если установить https://github.com/wladradchenko/advanced.wunjo.wladradchenko.ru, тогда можно будет обучать модель на своем голосе прямо из приложения, нужны только данные разметки (текст аудиофайлов) + сами аудиофайлы.

Look

Создаем сигнальную среду для резервирования транскодеров по схеме N+k

Wladradchenko Aug 7 2023 at 22:14

В теории хорошо, однако сколько времени занимает перенос на деле в реальных условиях?

Look

Создание deepfake видео и синтез речи open-source проект Wunjo AI

Wladradchenko Aug 7 2023 at 13:11

Привет. Спасибо за подписку. Ограничений нет, пользователи сами выбирают для себя ограничения (в том числе и этические, никаких цензур и водных знаков), т.к. приложение ставится на компьютер. Если с дипфейк на виндовс будет проблемы (там бывает нет прав на чтение модели нейронной сети из созданной папки cache, и результат создания видео будет, что лицо не найдено, но на самом деле если ставить расширение консоли, то видно, что нет прав на чтение модели нейронной сети, что я пока не знаю как решить), то лучше запускать проект из код через briefcase run. С другими ОС из установщика проблем не будет.

В будущем там появится замена лиц в видео (как расширение) и синхронизация губ человека из любого видео (где есть лицо), со звуком. Пример опубликовал на ютюб https://youtube.com/shorts/-LPxeuGBerI?feature=share

Look

1 2 3 4

Information

Specialization