ACLJul, 2023

PREADD:前缀自适应解码用于受控文本生成

TL;DR我们提出了一种灵活的控制文本生成的方法:前缀自适应解码(PREADD)。与现有方法使用辅助专家模型控制属性不同,PREADD 不需要外部模型,而是依靠线性组合从多个提示生成的输出标志 logit。具体而言,PREADD 将使用原始提示生成的输出标志与使用前缀预置提示生成的输出标志进行对比,从而对前缀所包含的任何属性进行正向和负向控制。我们在三个任务上评估了 PREADD—— 有害输出缓解、性别偏见减少和情感控制,并发现 PREADD 在每个任务的主要指标上相对增益达到 12% 或更多,不仅优于提示基准,而且优于辅助专家控制方法。