Dec, 2023
音频分类中最佳时间支持的选择与预训练嵌入
On the choice of the optimal temporal support for audio classification with Pre-trained embeddings
Aurian Quelennec, Michel Olvera, Geoffroy Peeters, Slim Essid
TL;DR通过研究音频输入时长对现有预训练嵌入模型的影响,本研究发现音频光谱图变换系统在较短的时间支持下仍然有效,从而大大减少了内存和计算成本,同时通过选择最佳时间支持,实现了在所有任务上具有竞争力的结果。