Oct, 2023

多模态设备定向语音检测的模态随机放弃策略研究

TL;DR调查了用于提高设备导向语音检测系统(DDSD)的融合方案以及非语言线索(特别是韵律特征)在DDSD中的使用,发现通过非线性中间融合,韵律能够将DDSD性能提高8.5%(在特定的固定操作点上的误接受率);在推理时,通过使用模态丢弃技术,可以将这些模型的性能提高7.4%(以FA度量),即使在缺少模态的情况下进行评估。