Jun, 2024

跨光谱 - 空间 - 时间领域的多尺度特征融合用于声音事件定位和检测

TL;DR本文针对声音事件定位和检测(SELD)提出了一个名为多尺度特征融合(MFF)模块的三阶段网络结构,以有效地提取跨光谱、空间和时间域的多尺度特征。将 MFF 模块融入 EINV2 网络,提出了 MFF-EINV2 方法,并在 2022 和 2023 的 DCASE 挑战任务 3 数据集上进行了实验证明了我们方法的有效性,达到了同类方法的最新性能水平(SOTA)。