BriefGPT.xyz
大模型
Ask
alpha
关键词
diffusion-based language models
搜索结果 - 3
扩散语言建模的承诺、展望与挑战
现代自回归型大型语言模型在自然语言处理基准测试中表现出色并应用于实际领域。然而,它们仍然受到自回归训练范式的一些限制。本文评估了最近提出的基于得分熵离散扩散 (SEDD) 的方法,并表明它是自回归生成的有希望的替代方案,但也存在一些不足之处
→
PDF
17 days ago
基于似然的扩散语言模型
该研究基于算法改进和计算资源扩展来提升扩散式语言模型,成功构建了一款表现优于已有模型的大规模扩散语言模型 Plaid 1B。
PDF
a year ago
SSD-2: 扩展和推断时间融合的扩散语言模型
通过研究和提出 Diffusion-based language models 的新方法,我们成功将 SSD-LM 模型从 0.4B 扩展至 13B 参数,同时提高了其训练和推断的效率,并能够根据指令进行微调,与自回归 LM 相比,Diff
→
PDF
a year ago
Prev
Next