Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!

Тоже сделал анимацию фото с речью в реальном времени, но в браузере с webGL. Поэтому нужен любой GPU, даже встроенный или на телефоне. Зато FasterLivePortrait и склеивание кусочков не нужно. Нужно один раз распознать 68 точек лица open pose или dlib. Голос из wav или создаётся Speech Api или Silero. Все движения определяются программно в JS.
https://prog-mania.github.io/fani/
Там чтобы браузер разрешил звук нужно пометить “Говорить”.
Говорящая лисичка, Айвенго и немного оптического потока