BriefGPT.xyz
大模型
Ask
alpha
关键词
masked diffusion
搜索结果 - 1
离散数据的简化和推广掩码扩散
掩蔽扩散模型是生成离散数据的自回归模型的替代选择,本论文提出了一个简单且通用的框架,解锁了掩蔽扩散模型的全部潜力,并在 OpenWebText 数据集上训练的模型在困惑度上超过了 GPT-2 模型,并在 5 个零 - shot 语言建模任务
→
PDF
a month ago
Prev
Next