Oct, 2023

持续对比式口语理解

TL;DR通过结合经验回放和对比学习的组合方法 COCONUT,我们研究了在渐增式学习(CIL)设置中学习序列到序列模型用于口语理解的问题,并通过对基于重放样本的修改的标准监督对比损失,使 COCONUT 通过将相同类别的样本拉近并推开其他样本来保留学习到的表示。此外,我们还利用一种多模态对比损失,通过对齐音频和文本特征帮助模型学习更具辨别性的表示新数据。我们还研究了不同的对比设计,以将对比损失的优势与用于蒸馏的教师 - 学生架构相结合。在两个已建立的 SLU 数据集上的实验证明了我们提出方法的有效性,并且比基准模型有显著的改进。我们还表明 COCONUT 可以与在模型的解码器端操作的方法结合使用,从而进一步改进指标。