Jun, 2024
研究生成文本中细粒度引文评估:忠实度度量的比较分析
Towards Fine-Grained Citation Evaluation in Generated Text: A Comparative Analysis of Faithfulness Metrics
Weijia Zhang, Mohammad Aliannejadi, Yifei Yuan, Jiahuan Pei, Jia-Hong Huang...
TL;DR基于综合评估框架的结果显示,没有一个单一的度量标准在所有评估中始终优秀,揭示了细颗粒度支持评估的复杂性,因此我们提供了制定更有效度量标准的实践建议。