Jun, 2024

UDA:一套用于现实世界文档分析中检索增强生成的基准测试套件

TL;DR通过引入一个包含2965个真实世界文档和29590个专家注释的问答对的基准测试套件,我们重新审视了解析数据和检索的设计选择以及多个文档领域和不同查询类型中答案质量的流行的LLM和RAG解决方案,我们的评估得出了有趣的发现,并强调了数据解析和检索的重要性。