Nov, 2023

ARES:一种用于检索增强生成系统的自动化评估框架

TL;DR通过使用综合训练数据,ARES 通过微调轻量级语言模型评估 RAG 组件的质量,在 KILT 和 SuperGLUE 两个领域多任务中准确评估 RAG 系统的有效性。