BriefGPT.xyz
Ask
alpha
关键词
sampled softmax estimation
搜索结果 - 1
分层注意力编码器解码器
本文提出了一种基于分层循环编码器解码器结构的模型,通过采样 softmax 估计开发了一种训练算法,可以在不需要高频解码器的情况下训练整个模型,显著降低了自回归模型训练的存储需求并改进了总的训练时间。
PDF
a year ago
Prev
Next