Oct, 2023

通过估计数据分布的比例进行离散扩散语言建模

TL;DR使用评分熵离散化损失函数来优化基于扩散模型的生成模型,在与 GPT-2 进行比较时取得了竞争性的似然度,并且在算法上也带来了明显的优势。