Mar, 2022

环境声音表示的扰动鲁棒性研究

TL;DR本文中,我们将 Holistic Evaluation of Audio Representations (HEAR) 扩展到评估在通道效应 invariant 的 embedding 性能,通过注入扰动来模拟通道效应和三种距离测量,评估两种嵌入模型 (YAMNet 和 OpenL3) 在两个城市数据集上的性能,结果表明 OpenL3 嵌入模型比 YAMNet 更稳健。