EMNLPNov, 2022

度量度量工具:文本语料库语义度量自动评估

TL;DR通过提出一系列的评估度量,本文对语义相似度度量的特征进行自动和可解释的评估,从而实现了对不同语义相似度度量方法行为的合理比较。通过对经典方法和最新方法的评估,我们的度量揭示了最近开发的度量在识别语义分布不匹配方面变得更好,而经典度量则对表面文本水平的扰动更加敏感。