Dec, 2023

关于音视觉语音识别对缺失视频的鲁棒性

TL;DR通过引入一个可以准确且可测试地评估鲁棒性的框架,我们对常见的多模态语音识别架构在各种噪声条件和测试套件中的鲁棒性进行了系统的实证研究,并展示了一种基于级联的与架构无关的解决方案,可以在存在缺失视频的情况下持续实现鲁棒性。