饱学猿
飞书用户1981
添加快捷方式
分享
AI主播虚拟人技术实现Wav2Lip【附完整版教程】及【效果评测】
输入“/”快速插入内容
AI
主播虚拟人技术实现Wav2Lip【附完整版教程】及【效果评测】
2023年5月30日创建
💡
AI
主播虚拟人技术实现
Wav2Lip
【附完整版教程】及【效果评测】
本案例涉及到所有内容,包括教程、模型、图片、视频、Wav2Lip等均集中打包分享给大家,可自行复现。
关注公众号【饱学猿】,回复数字"5301",即可获取下载链接。
更多过往内容:
见知识库
公众号【饱学猿】-知识库
免费分享,用于技术交流与学习,欢迎大家关注公众号,所有信息第一时间通过公众号同步大家!
持续更新....【
2023.05
】
前言
实现效果
本篇主要
实现图片说话
、
视频配音
(这里的核心都是人物口型与音频中的语音唇形同步)。
通过伪造【视频+音频】,采用
Wav2Lip技术,最终得到一个完整的视频文件,且视频的人物口型与音频内容一致。举例:一个人在读“啊”的时候,嘴应该是张开的,那么我们视频中人物口型对应的应该是张开的。以下是一张效果图)
本文目录
1.
深度伪造技术概述
2.
Wav2lip技术概述
3.
使用Wav2Lip进行AI主播虚拟人的深度实践
◦
环境设置
◦
文件准备
◦
运行操作步骤
◦
效果演示
4.
Wav2Lip
完整版教程的下载
本案例涉及到所有内容,包括教程、图片、视频、
Wav2Lip
等均集中打包分享给大家,可自行复现。
正文
1.
深度伪造技术概述
深度伪造一词译自英文“Deepfake”(“deep learning”和“fake”的组合)。它是一种利用机器学习的子领域——深度学习创建合成媒体的技术。
图片来自作者