BriefGPT.xyz
大模型
Ask
alpha
关键词
bayes-optimum
搜索结果 - 1
从上下文不确定性量化中对上下文学习能力的更好理解
本文研究了 Transformer 在线性回归任务上的训练,考虑了条件期望和条件方差的双目标预测任务,提供了不确定性量化目标,并揭示了训练 Transformer 接近贝叶斯最优的理论性质,以及在处理任务转移时表现不同于贝叶斯推断的能力。
PDF
a month ago
Prev
Next