ACLApr, 2024

多模态环境下对话中断检测

TL;DR实时检测对话中的中断对于会话型人工智能系统至关重要,因为它能采取纠正措施以成功完成任务。本文介绍了一种多模态上下文对话中断模型(MultConDB),该模型通过在实时转录文本上进行音频输入处理和下游自然语言处理模型推理来精确检测对话中断,并获得了 69.27 的 F1 分数,显著优于其他已知最佳模型。