Apr, 2022

面向端到端语音意图系统中细化语音到 BERT 对齐的逐令牌对比学习预训练

TL;DR通过交叉语境关注机制,引入了一种简单而新颖的技术,该技术用于从语音编码器中提取上下文嵌入,使得这些嵌入可以与基于 BERT 的上下文嵌入直接比较和对齐。使用类比对损失对这种预训练模型进行微调,直接使用语音进行意图识别可以达到最先进的性能,并在语音噪声较大的情况下进行正则化,与先前结果相比可以获得高达 8%的绝对改进。