Mar, 2024

WebCiteS: 中国网页搜索结果的带引文的查询聚焦摘要

TL;DR通过开发详细的度量标准并使自动评估器将句子分解为子主张以进行细粒度验证,我们为获取在正确引用来源方面面临挑战的大型语言模型提出了解决方案,强调了进一步改进的必要性。