BriefGPT.xyz
Ask
alpha
关键词
long-context tasks
搜索结果 - 2
长上下文任务是否需要长 LLMs?
在这项工作中,我们认为虽然最近取得了一些进展,但长上下文语言模型(long-LLMs)的学习和部署仍然是一个具有挑战性的问题。我们提出了一个名为 LC-Boost(长上下文引导器)的框架,该框架使得短上下文语言模型(short-LLM)能够
→
PDF
a month ago
充分利用上下文的 LLM
通过信息密集型(IN2)训练,我们提出了一种完全数据驱动的解决方案来克服长上下文的缺失问题,该方法能够有效地利用长上下文中的信息,并且在现实世界的长上下文任务中显著提高性能。
PDF
2 months ago
Prev
Next