Jul, 2024

ARM: 高效的带引导解码的自回归奖励模型

TL;DR在大量数据训练的语言模型中,需要仔细调整以在实际应用中安全部署。我们重新审查了引导解码范例,目标是使用任务特定奖励模型的评分来增强基础语言模型的逻辑回归。我们提出了一种简单但高效的自回归奖励模型参数化方法,实现了快速和有效的引导解码。在解毒和情感控制任务中,我们展示了我们高效参数化方法与RAD(一种功能强大但不够高效的引导解码方法)性能相当。