BriefGPT.xyz
Ask
alpha
关键词
few-shot accuracy
搜索结果 - 2
Rho-1: 不是所有的令牌都是你所需要的
先前的语言模型预训练方法一直对所有训练标记应用相同的下一个标记预测损失。挑战这一规范,我们认为 “语言模型训练并非所有语料库中的标记都同等重要”。我们的初步分析探究了语言模型的标记级训练动态,揭示了不同标记的独特损失模式。利用这些见解,我们
→
PDF
3 months ago
通过自我评估引导解码的分解增强推理
该研究提出了一种有效的提示方法,通过随机波束搜索融合自我评估指导,可以平衡生成链的质量 - 多样性权衡,并在少次学习的情况下,分别在 GSM8K、AQUA 和 StrategyQA 基准测试中比相应的 Codex-backboned 基线高
→
PDF
a year ago
Prev
Next