ICLRJan, 2020

使用比较歧视的自对抗学习进行文本生成

TL;DR提出了一种新的自我对抗学习(SAL)范式,通过使用相对鉴别器作为 GAN 的鉴别器,并引入自我改进奖励机制,成功地解决了 GAN 在生成文本方面的奖励稀疏性和模式崩溃问题,并在文本生成基准数据集上取得了更高质量和更稳定的性能表现。