Apr, 2024

双重混合: 实现从语音中的连续事件检测

TL;DR这篇论文介绍了关于语音事件检测的两个主要挑战:在不遗忘以前的事件的情况下持续整合新事件,以及语义与声学事件的分离。为了解决这些挑战,作者提出了一种新的任务——从语音中进行持续事件检测,并提供了两个基准数据集。他们提出的“双重混合”方法将语音专业知识与强大的记忆机制相结合,以提高适应性并防止遗忘。实验结果表明,这项任务在当前计算机视觉和自然语言处理领域的最新方法中仍存在非常大的挑战。该方法在各种连续学习序列中具有最低的遗忘率和最高的泛化水平,具有鲁棒性。相关的代码和数据可以在此https URL获得。