BriefGPT.xyz
大模型
Ask
alpha
关键词
non-autoregressive methods
搜索结果 - 2
TDT 损失全能:将目标之间的时间依赖性纳入非自回归时间序列预测
通过采用差分方法表示 TDT 并提出了一种无参数的插拔式解决方案 TDT Loss,该解决方案通过适应权重动态平衡目标预测和精细化 TDT 拟合,从而显著提高了非自回归模型的预测性能。
PDF
a month ago
大型语言模型中的加速生成技术综述
这篇论文综述了大型语言模型中加速文本生成的关键技术,包括推测解码、提前退出机制和非自回归方法,并对它们的原理、优势、限制和最新进展进行了讨论,旨在为自然语言处理领域的未来研究方向提供指导。
PDF
2 months ago
Prev
Next