BriefGPT.xyz
大模型
Ask
alpha
关键词
rigorous evaluation
搜索结果 - 2
基于检索增强生成的大型语言模型的基准测试
通过对 Retrieval-Augmented Generation 对大型语言模型的影响进行系统调查和评估,本文发现大型语言模型在噪音鲁棒性、负面拒绝、信息整合和对抗性鲁棒性方面存在挑战,表明在将 RAG 有效应用于大型语言模型方面仍有很
→
PDF
10 months ago
MM
DaisyRec 2.0: 为严格评估进行推荐基准测试
本研究介绍了一种基于模型无关和模型相关超因素的推荐系统评估方法。研究通过全面回顾 141 篇发表在 2017-2020 年的顶级会议论文,系统总结并分析了影响推荐性能的超因素,并针对 10 种推荐算法和 6 种数据集进行了实验验证,最终建立
→
PDF
2 years ago
Prev
Next