BriefGPT.xyz
Ask
alpha
关键词
audio input
搜索结果 - 3
众人皆醉我独醒:让我依你所愿地说话
该研究提出了一种基于音频输入的编辑目标肖像画面的方法,通过将目标视频帧分解为表情、几何和姿势三个正交参数空间,再利用循环神经网络将源音频转化为表情参数,并在保留原始视频背景的同时合成一个逼真的人物主体,最后利用动态编程构建一个有序连贯且令人
→
PDF
4 years ago
基础舞步生成的弱监督深度递归神经网络
本研究提出了一种基于弱监督深度循环方法的,使用音频功率谱作为输入的基础舞蹈生成模型,采用卷积层和多层 LSTM 处理音频输入,并利用对比代价函数调节音乐和舞蹈节拍之间的映射,同时从舞蹈节拍生成弱标签进行模型训练,实验结果表明,该模型可以在小
→
PDF
6 years ago
ECCV
基于条件生成对抗网络的语音驱动人脸再现
利用递归神经网络和条件生成对抗网络,根据音频输入生成具有准确口型同步的逼真面部图像。
PDF
6 years ago
Prev
Next