BriefGPT.xyz
Ask
alpha
关键词
one-to-many mapping
搜索结果 - 5
OSM-Net: 单次对多次的自然头部运动的一对多说话人头部合成
基于对上述现象的观察,我们提出了一种具有自然头部动作的一对多单拍说话头生成网络 OSM-Net。OSM-Net 构建了一个包含丰富多样的片级头部动作特征的运动空间,从而实现了合理范围内的一对多映射,生成更自然的真实头部运动。
PDF
9 months ago
无声视频中重建高质量语音
此研究提出了一种新颖的唇到语音系统,通过多个角度缓解一对多映射问题,包括引入自监督语音表示来消除同音异义词,并使用声学变异信息来建模多样的语音风格。此外,为了更好地解决上述问题,采用了基于流的后端网络来捕捉和优化生成语音的细节。广泛的实验证
→
PDF
10 months ago
基于可逆图神经网络的反应分布学习,用于多种适当的面部反应生成
本文提出了第一个多恰当面部反应生成框架,通过将一对多映射面部反应生成问题重新转换为一个对一个映射问题,提出适当的面部反应分布学习策略,利用新颖的可逆多维边缘图神经网络 (REGNN) 解码恰当的面部反应,实验结果表明,利用该方法生成的面部反
→
PDF
a year ago
AAAI
使用多头视听记忆来区分同音异义词进行唇读
本文提出一种多头视听记忆模型 (MVM),用于减轻唇读中信息不足和同音异义现象的挑战。该模型由音频 - 视觉数据集训练得到,结合多头记忆键和值来保存可区分同音异义现象的音频和视觉特征,并且在考虑上下文语境的多时间级别下使用,有效提高了唇读的
→
PDF
2 years ago
针对输入语句学习生成多个风格转移输出
该论文提出了一种基于一对多映射和潜变量分解的对文本风格转换任务的方法。实验结果表明,该方法在多个公共数据集上的效果明显优于其他文本风格转换方法。
PDF
4 years ago
Prev
Next