BriefGPT.xyz
Ask
alpha
关键词
audio-driven talking face generation
搜索结果 - 3
ICLR
Real3D-Portrait: 一次合成逼真的 3D 语音肖像
Real3D-Potrait 是一种框架,通过使用大型图像到平面模型和高效的运动适配器,从而改进了一次性 3D 重建的能力,实现了精确的运动条件动画,并利用头 - 躯干 - 背景超分辨率模型生成具有自然躯干运动和可切换背景的逼真视频,同时支
→
PDF
6 months ago
ICCV
堵塞泄漏:通过防止无意的信息传递推进基于音频的说话人脸生成
利用给定的音频和参考帧生成口型同步、逼真的人脸视频是一项重要任务,其中的关键挑战涉及生成图像的整体视觉质量以及嘴部的音频 - 视频同步。本文首先指出了最近几种音频驱动人脸生成方法中同步方法存在的问题,包括从参考图像到生成图像的唇部和姿势信息
→
PDF
a year ago
基于音频驱动的面部动态表情多样而逼真的生成技术
DIRFA 是一种新的方法,可以通过基于 Transformer 的概率映射网络生成出同一音频驱动下具有多样化但真实面部动画的语音合成人脸,并能通过源图像使用通用生成网络合成出逼真的说话人脸。
PDF
a year ago
Prev
Next