BriefGPT.xyz
Ask
alpha
关键词
modality fusion gates
搜索结果 - 1
LRS2 数据集中重叠语音的音视频识别
本研究探讨了利用视听技术识别重叠的语音信息的三个问题,包括基本体系结构设计,模态融合的建议设计门,以及通过优化的统一的方法来建立 AVSR 系统。实验结果表明,该系统在 LRS2 数据集上的性能超过了传统的语音分离和识别组件的流水线架构,可
→
PDF
5 years ago
Prev
Next