BriefGPT.xyz
Ask
alpha
关键词
der
搜索结果 - 2
ECCV
2022 年 Ego4D 挑战赛中英特尔实验室:音视频对话更优秀的基线
报告中介绍了我们在 Ego4D Challenge 2022 中处理 Audio-Visual Diarization 任务的方法,该方法通过对模型的训练计划进行修改改进了声音活动的检测性能,证明了采用现成的语音活动检测模型可以有效地消除误
→
PDF
2 years ago
基于 ASR 的端到端神经化分离
本文提出基于 Conformer 的端到端神经口头日记(EEND)模型,该模型利用从自动语音识别(ASR)模型导出的语音输入和特征。通过将 ASR 特征与声学特征相结合,采用新的自注意力机制来建立鲁棒的说话人表示,并使用多任务学习来最小化
→
PDF
2 years ago
Prev
Next