MMJul, 2023

级联跨模态变压器对于请求和投诉检测

TL;DR我们提出了一种新颖的级联跨模态变换器(CCMT),结合语音和文本转录以检测电话对话中的客户要求和投诉。我们的方法利用多模态范例,通过使用自动语音识别(ASR)模型转录语音并将转录成不同语言。随后,我们将语言特定的基于 BERT 的模型与 Wav2Vec2.0 音频特征结合使用在一个新颖的级联交叉注意力变换器模型中。我们将我们的系统应用到 ACM Multimedia 2023 计算言语学挑战赛的请求子挑战中,分别对于投诉和请求类别达到了 65.41%和 85.87%的非加权平均召回率(UAR)。