ACLMar, 2022

使用基于 AMR 的语义操作进行对话连贯性评估

TL;DR提出使用抽象含义表示 (AMR) 进行语义级别操纵的对话连贯性评价标准 (DEAM),在多个对话数据集上,DEAM 与人类判断的相关性高于基准方法,且能够区分基准操纵生成的连贯和不连贯的对话,DEAM 具有语义级别的操纵和自然的负样本生成潜力。