BriefGPT.xyz
大模型
Ask
alpha
关键词
gradient steps
搜索结果 - 3
ICLR
如何训练你的 MAML 在少样本分类领域表现卓越
在 Few-shot classification 这个问题上,我们探究了如何训练 MAML 表现得更美好,发现 MAML 需要大量的梯度步骤才能适应少样本分类,敏感于试验时分类标签的赋值,本文提供了多种方法解决其排列不变性。我们命名为 U
→
PDF
3 years ago
随机梯度下降和随机八卦算法中的 Nesterov 加速算法连续化视角
本文提出了连续 Nesterov 加速法,将 Nesterov 加速法的变量用连续时间参数索引,使两个变量连续混合,其间隔时间内随机进行梯度步骤。我们证明了该变体具有与 Nesterov 原始加速法相似的收敛率,并且具有连续和离散框架的最佳
→
PDF
3 years ago
一类针对时变凸优化的预测 - 纠正方法
本文提出一种基于预测和修正步骤的算法,采用离散时间采样方案,在每个时间步长采样一次问题数据,以找到和跟踪解轨迹,用于无约束凸优化问题,并且在某些情况下,渐近误差仅为 O(h ^ 2),大大优于梯度校正步骤仅误差为 O(h)的现有技术。
PDF
9 years ago
Prev
Next