EMNLPAug, 2019

分析鹦鹉学舌在释义生成数据集上的表现

TL;DR本文分析了用于释义生成研究的常用数据集,发现当用标准度量进行评估时,简单地模仿输入句子超越了文献中的最先进模型,说明模型可能似乎熟练地生成释义,尽管对输入句子只进行了微不足道的更改,甚至完全没有更改。