Jun, 2023

Diplomat: 一种针对环境中情境语用推理的对话数据集

TL;DR本研究提出新的基准测试系统 ——Diplomat,并针对语用推理和情境对话理解问题提出两个任务:语用识别与推理以及对话问答。通过在 4,177 个多轮对话中建立数据集,并利用状态 - 时间优化算法实现实验,发现大型语言模型表现不佳,情境理解是构建良好人机交互的关键因素,现有模型在语用推理应用方面存在缺陷,进一步需要更多的关注以提高对上下文的理解、推理和暗示意义建模的能力。