Nov, 2022

音频标记的本体感知学习和评估

TL;DR本研究提出了一种新的音频标记任务评估度量 - 本体论感知平均准确率 (OmAP), 该评估度量利用 AudioSet 本体信息,在评估中重新权重模型预测的假阳性事件,提供了更多在本体图中不同粗粒度级别下模型性能的见解,并且比传统的平均准确率 (mAP) 更符合人类感知。此外,本研究还提出了一种新的损失函数 (OBCE), 通过重新加权基于本体距离的二元交叉熵损失 (BCE) 来验证利用本体信息的重要性,实验证明 OBCE 在 AudioSet 标记任务中可以提高 mAP 和 OmAP 的表现。