May, 2023

音频问答的多尺度关注

TL;DR本篇研究提出了一种多尺度窗口注意力融合模型,通过异步混合注意力模块和多尺度窗口注意力模块,提高了音频场景理解中的时间推理能力。