BriefGPT.xyz
Ask
alpha
关键词
activation caching
搜索结果 - 1
M2T:双重掩码变换加速解码
本文演示了在神经图像压缩中应用面向遮蔽令牌预测训练的双向变压器以实现最先进的结果。通过使用预定义的、确定性调度,本文证明这些模型在图像压缩方面表现良好。同时在训练过程中使用面向遮蔽的关注力以及在推断过程中使用激活缓存,能够使我们的模型显著地
→
PDF
a year ago
Prev
Next