BriefGPT.xyz
Ask
alpha
关键词
long-context understanding
搜索结果 - 3
不留下任何文件:扩展多文档问答中的长上下文语言模型基准测试
提出了一个新的长上下文基准测试 Loong,通过扩展的多文档问题回答来实现与现实场景的对齐,来评估模型的长上下文建模能力。
PDF
11 days ago
超越极限:大型语言模型中扩展上下文长度的技术综述
本文调查了扩展序列长度的技术和方法,包括架构修改和注意机制的改变等多种方法,并讨论了当前方法的局限性和未来研究方向建议,强调了序列长度对大型语言模型进一步发展的重要性。
PDF
5 months ago
LooGLE: 长文本语言模型是否理解长文本上下文?
基于 LooGLE 评估模型的表现,研究显示商业模型在短依赖任务上胜过开源模型,同时也揭示了长依赖任务的困难,并指出在短问答任务中检索式技术有着明显的好处,而扩展上下文窗口长度的策略对于长上下文理解的影响有限。
PDF
8 months ago
Prev
Next