BriefGPT.xyz
Ask
alpha
关键词
multi-task linear regression
搜索结果 - 2
多头 Softmax 注意力的上下文学习训练动态:出现、收敛和最优性
我们研究了多头 softmax 注意力模型在上下文学习多任务线性回归中的渐变流动动力学。通过适当选择初始化,我们确定了梯度流的全局收敛性。此外,我们证明了梯度流动力学中出现了有趣的 “任务分配” 现象,在这个过程中,每个注意力头专注于解决多
→
PDF
4 months ago
可证明的线性表示元学习
本文提出了一种基于 Meta-learning 的多任务线性回归算法,该算法能够通过低维线性表示快速学习多个相关任务,同时将这些知识传递到新的未见过的任务中,并提供了信息论下限,证明了该算法的高效性。
PDF
4 years ago
Prev
Next