EMNLPOct, 2023

TaskDiff: 一种针对任务导向对话的相似度度量

TL;DR构建使用 ChatGPT 等大型语言模型的对话式数字助手需要更多关注于提示工程和评估方法。文本相似度度量是这些分析和评估的关键要素。然而,现有的相似度度量方法不能有效地用于面向任务的对话,因为它们没有利用独特的对话特征。为了解决这一问题,我们提出了 TaskDiff,一种新颖的对话相似度度量方法,利用对话组成部分(话语、意图和插槽)及其分布来计算相似度。对基准数据集上 TaskDiff 进行了广泛的实验评估,结果表明其性能优越,并在其他相关方法上具有改进的鲁棒性。