Jun, 2024

DAISY: 自适应数据自我监督的语音表示模型的早期退出

TL;DR自主训练的语音模型在各种任务中已显示出其有用性,但其庞大的体积限制了在计算能力和内存较低的设备中的使用。本论文探讨了一种早期退出的方法,用于通过尽早退出网络的前向过程来减少延迟。我们介绍了数据自适应自主训练早期退出(DAISY)方法,该方法根据自主训练损失来决定何时退出,消除了多轮训练和微调的需求。DAISY 在 MiniSUPERB 基准测试上与 HuBERT 的性能相匹配,但推理时间更快。我们对 DAISY 的适应性进行了分析,结果显示该模型在干净数据上早期退出(使用较少层),而在噪声数据上晚期退出(使用更多层),根据每个样本的噪声水平动态调整推理的计算成本。