BriefGPT.xyz
Ask
alpha
关键词
long context tasks
搜索结果 - 2
KV 缓存压缩,我们必须拿什么作为交换?长上下文能力方法的全面基准测试
大语言模型的长上下文能力是其关键能力之一,本研究填补了现有方法的空白,并评估了 10 多种最新方法在长上下文任务领域的表现,揭示了许多以前未知的现象,为未来长上下文能力大语言模型的发展提供了洞见和工作平台。
PDF
9 days ago
LongAlign: 大型语言模型的长文本对齐配方
扩展大型语言模型以有效处理长篇背景需要依据相似长度的输入序列进行指导微调,本文提出了 LongAlign 框架,包括长篇背景对齐的指导数据、训练和评估方法,通过 Self-Instruct 构建了包含各种长篇背景任务的数据集,采用打包和排序
→
PDF
5 months ago
Prev
Next