AI主播虚拟人技术实现Wav2Lip【附完整版教程】及【效果评测】

2023年5月30日创建

💡

AI主播虚拟人技术实现Wav2Lip【附完整版教程】及【效果评测】​
本案例涉及到所有内容，包括教程、模型、图片、视频、Wav2Lip等均集中打包分享给大家，可自行复现。关注公众号【饱学猿】，回复数字"5301"，即可获取下载链接。​

更多过往内容：见知识库公众号【饱学猿】-知识库

免费分享，用于技术交流与学习，欢迎大家关注公众号，所有信息第一时间通过公众号同步大家！​

持续更新....【2023.05】

前言

实现效果

本篇主要实现图片说话、视频配音（这里的核心都是人物口型与音频中的语音唇形同步）。​

通过伪造【视频+音频】，采用Wav2Lip技术，最终得到一个完整的视频文件，且视频的人物口型与音频内容一致。举例：一个人在读“啊”的时候，嘴应该是张开的，那么我们视频中人物口型对应的应该是张开的。以下是一张效果图）​

本文目录

1.
深度伪造技术概述​

2.
Wav2lip技术概述​

3.
使用Wav2Lip进行AI主播虚拟人的深度实践​
◦
环境设置​
◦
文件准备​
◦
运行操作步骤​
◦
效果演示​

4.
Wav2Lip完整版教程的下载​

本案例涉及到所有内容，包括教程、图片、视频、Wav2Lip等均集中打包分享给大家，可自行复现。​

正文

1.
深度伪造技术概述​

深度伪造一词译自英文“Deepfake”(“deep learning”和“fake”的组合)。它是一种利用机器学习的子领域——深度学习创建合成媒体的技术。​

图片来自作者

AI主播虚拟人技术实现Wav2Lip【附完整版教程】及【效果评测】​