BriefGPT.xyz
Ask
alpha
关键词
training llms
搜索结果 - 2
E^2-LLM:大型语言模型的高效和极端长度扩展
我们提出了一种名为 E2-LLM 的高效和极长扩展的大型语言模型方法,通过减少计算成本并对不同样本进行增强方法来在推理时支持任意上下文长度,实验结果表明其在具有挑战性的长上下文任务中的有效性。
PDF
6 months ago
安全调校型 LLaMAs:提升遵循指令大型语言模型安全性的经验教训
训练大型语言模型遵循指示能够使其在各种任务上表现更好,但完全符合的模型会遵循即使是最恶意的指示并且容易生成有害内容。本文提出了对强调帮助而不是安全性的模型安全性的担忧。我们展示了一些流行的经过指示调优的模型高度不安全。此外,我们证明了在训练
→
PDF
10 months ago
Prev
Next