BriefGPT.xyz
大模型
Ask
alpha
关键词
long-context modeling
搜索结果 - 3
不留下任何文件:扩展多文档问答中的长上下文语言模型基准测试
提出了一个新的长上下文基准测试 Loong,通过扩展的多文档问题回答来实现与现实场景的对齐,来评估模型的长上下文建模能力。
PDF
9 days ago
ACL
长上下文真不算长:大语言模型的长依赖数据勘探者
提出了一个名为 ProLong 的数据挖掘框架,该框架可以在大型语言模型(LLMs)的训练中分配每个样本一个长依赖得分,用于排名和过滤对增强长上下文建模能力更为有利的样本,实验结果表明,ProLong 能够有效识别具有长依赖关系的文档,并且
→
PDF
a month ago
为长上下文理解的 Transformer 装备随机访问读取
长文本建模提出了对基于 Transformer 的大型语言模型(LLMs)的重大挑战,我们提出了一种新的阅读策略,即随机访问,可以使 Transformer 模型在处理长文档时高效地跳过不相关的标记。通过预训练、微调和推理阶段的实验证明了我
→
PDF
a month ago
Prev
Next