Jul, 2020
双时间尺度双层优化框架:复杂性分析及其在演员 - 评论家算法中的应用
A Two-Timescale Framework for Bilevel Optimization: Complexity Analysis and Application to Actor-Critic
Mingyi Hong, Hoi-To Wai, Zhaoran Wang, Zhuoran Yang
TL;DR本文研究了用于双层优化的两时间尺度随机算法框架,并分析了算法的收敛性及应用于自然演员 - 评论家算法的情形。