基于随机 telescopingsum 的循环和限制有效优化

May, 2019

基于随机 telescopingsum 的循环和限制有效优化

Efficient Optimization of Loops and Limits with Randomized Telescoping Sums

Alex Beatson, Ryan P. Adams

TL;DR本文提出了一种随机抽样方法 — 随机望远镜梯度估计器，用于解决目标函数计算困难，梯度计算偏差较大的优化问题，通过线性组合计算序列的求和来提供低成本无偏的梯度估计。

Abstract

We consider optimization problems in which the objective requires an inner loop with many steps or is the limit of a sequence of increasingly costly approximations. meta-learning, training →

optimization problems meta-learning recurrent neural networks differential equations gradient estimators

发现论文，激发创造

实时递归学习的最优 Kronecker-Sum 逼近

研究 RNN 的训练方法，提出新的 RTRL 逼近算法 OK-Kronecker-Sum 并证明其优秀性能，经实验验证 OK- Kronecker-Sum 能够在真实世界任务中匹配 TBPTT，在合成字符串记忆任务中优于 TBPTTs。

Feb, 2019

混合确定性 - 随机方法用于数据拟合

本文介绍了一种结构化数据拟合应用的优化问题的混合方法，同时具有增量梯度算法的高效迭代和完全梯度算法的稳定收敛性，基于这种方法提出了一个实用的拟牛顿算法实现，并通过数值实验证明了其潜在优势。

Apr, 2011

可达到最坏情形收敛速率的迭代算法直接合成

本文提出了一种使用健壮控制合成技术来进行算法搜索的方法，以获得在具有任意有限内存的算法上成立的最坏情况下性能保证，并证明了这种方法比先前方法更为有效。

Apr, 2019

利用学习的方法保证调整步长

本论文在简单问题上给出了学习优化算法的元优化保证，并展示了关于学到的优化器的性质。

Jun, 2020

分布式和随机优化的随机梯度外推

本文探讨了在分布式多代理网络上定义的一类有限和凸优化问题，通过开发一种新的随机渐进梯度算法（RGEM），解决了无需精确梯度评估，但可以实现最优复杂度界限的问题，同时维持了最佳的随机复杂度（直至一定的对数因子），作者同时基于 Nesterov 的加速梯度方法开发了算法。

Nov, 2017

黑盒函数的逐步优化

本论文提出了一种新的方法，利用估计梯度来逐渐自适应地优化机器学习中的未知函数，并验证了该方法在低维和高维问题上的实验性能，证明了在调整高维超参数时我们的方法的优越性。

Jun, 2019

利用稀疏连接和选择性学习的在线实时递归学习

这篇论文介绍了一种基于循环神经网络的状态构建方法，提出了能够让实时递归学习可扩展的两个约束条件，并在基准测试和政策评估中证明了其有效性。

Jan, 2023

快速二次时间尺度随机梯度法及其在强化学习中的应用

提出了一种用于解决两时间尺度优化问题的新方法，通过利用平均化步骤改善算子的估计，消除了主要变量之间的直接耦合，从而大大加快了收敛速度，并在强凸性、凸性、Polyak-Lojasiewicz 条件和一般非凸性等各种情况下改进了传统两时间尺度随机逼近算法的复杂性，该算法在强化学习中表现出色，超越或与现有的最先进方法相匹配，并通过强化学习中的数值模拟验证了理论结果。

May, 2024

理解和校正学习优化器训练中的病态

通过对学习到的优化函数进行训练以执行特定任务，我们提出了一种训练方案，它可以比经过调整的一阶方法更快地训练卷积网络，并在测试损失上得到改进。

Oct, 2018

增量式截断最小二乘法

本文介绍了一种低秩 LSTD 算法，该算法能更好地平衡计算效率和采样效率，使过去的样本高效地实现对最少二乘法时间差分（LSTD）的采样复杂度，同时实现近似 LSTD 的样本复杂度。我们在模拟中给出了关于截断低秩逼近所得解的模拟界限，这表明一个偏差 - 方差折衷需要依赖秩的选择。我们证明了该算法在基准任务和高维能量分配领域的策略评估中有效地平衡了计算复杂性和采样效率。

Nov, 2015