BriefGPT.xyz
Ask
alpha
关键词
context extension
搜索结果 - 3
可扩展的嵌入:适用于 LLM 上下文长度的灵活乘数
通过利用高信息密度的紧凑输入单元,可实现对大范围上下文的访问,使得可拓展嵌入成为高效、灵活且兼容的方法来扩展大语言模型的上下文。
PDF
5 months ago
BGE 地标嵌入:用于检索增强的长上下文大语言模型的无分块嵌入方法
通过可扩展嵌入实现了高质量、灵活、具有成本效益的扩展大型语言模型的上下文,通过优化架构和训练方法,具有上下文扩展的高灵活性、低成本的训练和与现有大型语言模型的兼容性,进而在长上下文语言建模和理解任务上进行综合评估,验证了可扩展嵌入作为一种有
→
PDF
5 months ago
LongLoRA: 长文本大语言模型的高效微调
LongLoRA 是一种高效的微调方法,通过有限的计算成本扩展了预训练大型语言模型(LLMs)的上下文大小。
PDF
10 months ago
Prev
Next