BriefGPT.xyz
大模型
Ask
alpha
关键词
hyper-gradient
搜索结果 - 3
基于超梯度的双层强化学习方法并避免较低级别的凸性
通过使用与规则化 RL 相关的固定点方程,我们以全一阶信息表征超梯度,从而回避了对低级凸性的假设,并提出了基于模型和无模型的双层强化学习算法,都被证明具有收敛速度 O (ε^(-1))。
PDF
a month ago
LancBiO:基于 Krylov 子空间的动态 Lanczos 辅助双层优化
通过 Lanczos 方法构建低维近似 Krylov 子空间,解决偏导数求逆问题,提高双层优化问题的效率,并在合成问题和深度学习任务中展示了收敛速度和效率。
PDF
3 months ago
AAAI
无黑塞矩阵逆的双层优化全单循环算法
本文提出了一种新的基于 Hessian 的、不需要求逆的完全单循环算法 (FSLA) 用于双层优化问题,并理论和实践上验证了该算法的有效性。
PDF
3 years ago
Prev
Next