Oct, 2021

FilterAugment: 一种声学环境数据增强方法

TL;DR提出了一种名为 FilterAugment 的数据增强方法,用于在不同声学环境下正则化音频模型。通过在频率带上应用不同的权重,这种方法可以模拟声学滤波器,从而使模型能够从更广泛的频率区域提取相关信息。实验证明,与频率屏蔽相比,FilterAugment 在声音事件检测性能方面的提升为 6.50%,在说话人验证方面取得了 1.22%的等误率。