BriefGPT.xyz
大模型
Ask
alpha
关键词
long-context llms
搜索结果 - 3
LongRAG: 增强检索增强生成的长文本语言模型
在传统的 RAG 框架中,检索单元通常很短,而我们提出的 LongRAG 框架则将整个维基百科以 4K-token 为单位处理,通过增加单元大小和减少总单元数量,降低了检索器的负担,并在没有任何训练的情况下实现了最佳结果,这为将 RAG 与
→
PDF
13 days ago
能否在长上下文中使用多样本情境学习来帮助 LLM 法官?更多观察,更好判断!
使用大型语言模型作为评判器评估大型语言模型的性能,可能引入潜在的偏见,并对评估结果的可靠性提出关切。为了缓解这个问题,我们提出和研究两种版本的多示例上下文提示(加强和无监督),以帮助 GPT-4o 作为评判器进行单答案打分。基于设计的提示,
→
PDF
17 days ago
ELITR-Bench:面向长篇对话的语言模型评测
我们的研究提出了一个新的长文本上下文大型语言模型测试基准,名为 ELITR-Bench,侧重于实际的会议助手场景。我们使用 271 个手工制作的问题和其真实答案来增强现有的 ELITR 语料库的转录文本,实验结果显示当前公开源代码和专有模型
→
PDF
3 months ago
Prev
Next