BriefGPT.xyz
Ask
alpha
关键词
length bias
搜索结果 - 5
遵循指导中的长度限制
训练能够在推断时受到长度约束的指令控制模型,通过指令被控制的长度评估表现优于标准的指令跟随模型,如 GPT4、Llama 3 和 Mixtral。
PDF
11 days ago
长度可控的 AlpacaEval:消除自动评估偏见的简单方法
通过回归分析控制偏见,减少 AlpacaEval 的长度偏差,提高与 Chatbot Arena 的相关性。
PDF
3 months ago
守口如瓶:从人类反馈中减轻强化学习的长度偏差
通过使用 “Product-of-Experts(PoE)” 技术,我们提出了一种创新的解决方案,将奖励建模与序列长度的影响相分离,从而使语言模型的性能得到提升。
PDF
9 months ago
用于研究长度偏差和退化重复的生成任务连续体
通过引入新的实验框架,我们可以在保持所有其他方面不变的情况下,平稳地改变任务约束性,发现重复使用和长度偏差与任务约束性相关,而这些问题只是影响整个分布的模式,并且很难归因于分布熵的变化。
PDF
2 years ago
神经文本生成器的解码策略
该研究对语言生成任务和解码策略之间的相互作用进行了全面分析,测量了生成文本属性随着解码策略和任务的变化情况,并使用人工和自动评估发现了之前观察到的和令人惊讶的结果,如语言生成中的多样性与质量之间的平衡是非常特定于任务的,而模式搜索方法如光束
→
PDF
2 years ago
Prev
Next