BriefGPT.xyz
大模型
Ask
alpha
关键词
babel dataset
搜索结果 - 2
无缝融合位置编码的人体动作组合
FlowMDM 是第一个基于扩散的模型,它生成无需后处理或冗余去噪步骤的无缝人体运动组合。通过引入融合位置编码的技术,在绝对阶段恢复了全局运动连贯性,在相对阶段构建了平滑真实的过渡。FlowMDM 能够在 Babel 数据集上取得准确性、真
→
PDF
4 months ago
使用知识蒸馏的语言通用适配器学习实现端到端多语言语音识别
本文提出了一个基于预训练模型的语言通用适配器学习框架,用于端到端的多语言自动语音识别。通过插入特定于语言和语言通用适配器来微调 Wav2Vec 2.0 预训练模型,然后使用在线知识蒸馏来使语言通用适配器学习特定于语言和通用特征,通过利用语言
→
PDF
a year ago
Prev
Next