length bias | BriefGPT - AI 论文速递

关键词length bias

搜索结果 - 5

遵循指导中的长度限制
训练能够在推断时受到长度约束的指令控制模型，通过指令被控制的长度评估表现优于标准的指令跟随模型，如 GPT4、Llama 3 和 Mixtral。
PDF11 days ago
长度可控的 AlpacaEval：消除自动评估偏见的简单方法
通过回归分析控制偏见，减少 AlpacaEval 的长度偏差，提高与 Chatbot Arena 的相关性。
PDF3 months ago
守口如瓶：从人类反馈中减轻强化学习的长度偏差
通过使用 “Product-of-Experts（PoE）” 技术，我们提出了一种创新的解决方案，将奖励建模与序列长度的影响相分离，从而使语言模型的性能得到提升。
PDF9 months ago
用于研究长度偏差和退化重复的生成任务连续体
通过引入新的实验框架，我们可以在保持所有其他方面不变的情况下，平稳地改变任务约束性，发现重复使用和长度偏差与任务约束性相关，而这些问题只是影响整个分布的模式，并且很难归因于分布熵的变化。
PDF2 years ago
神经文本生成器的解码策略
该研究对语言生成任务和解码策略之间的相互作用进行了全面分析，测量了生成文本属性随着解码策略和任务的变化情况，并使用人工和自动评估发现了之前观察到的和令人惊讶的结果，如语言生成中的多样性与质量之间的平衡是非常特定于任务的，而模式搜索方法如光束
PDF2 years ago