CVPRApr, 2021

音视频整合能否增强对多模态攻击的鲁棒性?

TL;DR该论文旨在研究多模态攻击下机器的多感官感知能力,针对多模态对抗攻击对视听事件识别任务的影响,提出弱监督声音定位模型并基于音视频相似性约束和外部特征存储器实现了一种反对抗防御方法,实验结果表明该方法可有效提高视听网络的鲁棒性。