ICLRDec, 2020

一种基于分布式的控制文本生成方法

TL;DR本文提出一种基于分布式方法的控制文本生成方案,旨在在单个形式框架中指定 “点对点” 和 “分布式” 约束,实现与初始 LM 分布 KL 散度最小的目标 LM 的训练。同时,基于 Energy-Based Model 表示确定最优目标分布。该方案通过自适应分布式模型改进了 Policy Gradient. 作者在实验中表明,该方案在满足约束方面较其它方法具有优势。实验结果还表明该方案应对了语言模型中 “偏见” 的问题。