BriefGPT.xyz
Ask
alpha
关键词
audiovisual dataset
搜索结果 - 1
缺失鲁棒性的视觉增强多模态语篇错流检测
现有的语音故障检测技术只依赖于声学数据,本研究提出了一种实用的多模态故障检测方法,利用可用的视频数据与音频结合。我们策划了一个音频 - 视觉数据集,并提出了一种新颖的融合技术,使用权值共享的模态不可知编码器来学习时态和语义上下文。我们的可靠
→
PDF
25 days ago
Prev
Next