BriefGPT.xyz
Ask
alpha
关键词
talking face video
搜索结果 - 4
语音到视频生成的跨模态蒸馏技术(Speech2Video: Cross-Modal Distillation for Speech to Video Generation)
这篇研究论文介绍了一种仅基于语音生成说话脸部视频的全新方法,并提出了一种轻量级的跨模态蒸馏方法,这种方法能够从未标记的视频输入中提取出情感和身份信息,然后使用对抗生成网络将提取的特征整合到说话脸部视频片段中,实验结果表明这一提出的框架能够从
→
PDF
3 years ago
野外语音到唇形生成只需要一个口型同步专家
研究如何 lip-sync 一个任意身份的说话面部视频以匹配目标语音片段,并使用 Wav2Lip 模型和新的评估基准,成功地在自由视频中实现了较好的 lip-sync 精度。
PDF
4 years ago
分层交叉模态对话脸动态像素损失生成
提出了级联 GAN 方法来生成对话式人脸视频,该方法在不同的人脸形状、视角、面部特征和嘈杂声音条件下具有鲁棒性,通过将音频转换为高级结构,即面部标志点,然后在标志点的条件下生成视频帧,避免了不相关的音频视觉信号之间的假冒关联,利用动态可调整
→
PDF
5 years ago
基于条件循环对抗网络的说话人脸生成
提出一种基于条件对抗生成的视频网络,该网络将音频输入作为条件并考虑面部图像在不同视频帧之间的时间依赖性,从而实现唇部和面部平稳过度,最终通过音频片段提取的音素分布信息,开发出一种样本选择方法,可以在不降低生成视频质量的情况下有效减小训练数据
→
PDF
6 years ago
Prev
Next