May, 2023

扩散模型能否在文本生成中实现更好性能?在训练和推断之间的桥梁!

TL;DR本研究介绍了扩散模型在文本生成任务中的应用,并提出了两种桥接训练和推理之间差异的方法,分别为 “距离惩罚” 和 “自适应衰减采样”,实验证明这两种方法能够在保证性能的情况下加速 100 倍至 200 倍。