Jun, 2024

原始主体一阶优化

TL;DR此研究论文提出了一种以强化学习为基础的数值优化方法,通过简化的状态表示和代理 - 环境交互来近似序贯更新算法迭代步骤的最优策略,成功应用于有限优化问题中,优于传统优化算法的超参数优化。结果表明,结合简洁的状态表示,基础强化学习方法可用作复杂优化问题的启发式方法,为代理式优化方法铺平了道路。