Aug, 2022

使用句子作为文本评估的基本单位

TL;DR本研究介绍了一种新的文本生成评估指标 SMART,其以句子为匹配的基本单位,通过句子匹配功能软匹配候选句子和参考句子,并与源文档中的句子进行比较以进行评估。实验结果表明,SMART 指标在评估长文本时优于其他评估指标,在无神经网络时再现了基于模型的指标,同时对于长摘要的评估效果良好,且不偏向特定模型。