Sep, 2023

Asca:少量音频数据揭示更多洞见

TL;DR基于 CoAtNet 的 ASCA 结合了 Transformer-convolution 混合架构、新颖的网络设计和注意力技术,结合数据增强和正则化策略,在 BirdCLEF2023 和 AudioSet (Balanced) 测试中分别获得了 81.2% 和 35.1% 的准确率,明显优于竞争方法。