Dec, 2023

音频分类中最佳时间支持的选择与预训练嵌入

TL;DR通过研究音频输入时长对现有预训练嵌入模型的影响,本研究发现音频光谱图变换系统在较短的时间支持下仍然有效,从而大大减少了内存和计算成本,同时通过选择最佳时间支持,实现了在所有任务上具有竞争力的结果。