AAAIAug, 2023

装备声音事件检测与语言模型能力

TL;DR通过语言模型结合音频特征和文本特征,本研究提出了一种高效的声音事件检测方法,实现了精准的声音事件分类和时序定位。与传统方法相比,该模型更简洁全面,直接利用语言模型的语义能力生成时序和事件序列,获得了准确的声音事件检测结果。