ECCVJul, 2022

使用 SSW60 数据集探索细粒度音视频分类

TL;DR本文介绍了一种新的基准数据集 SSW60,旨在促进音视频细粒度分类研究,覆盖 60 种鸟类,可用于图像、音频和视频分类,实验结果表明,使用音视频融合方法比单独使用图像或音频方法的性能更好,同时进行了有趣的模态转换实验。