BriefGPT.xyz
Ask
alpha
关键词
residual glancing training
搜索结果 - 1
Diff-Glat: 并行序列到序列学习的扩散环视变换器
Diff-Glat 是一种采用模态扩散过程和残差凝视训练的非自回归模型,旨在解决多模态数据建模困难问题,相较于自回归变换器,Diff-Glat 在解码效率和准确性方面均表现出卓越的性能。
PDF
2 years ago
Prev
Next