Jan, 2020

基于 Fenchel-Rockafellar 对偶的强化学习

TL;DR本论文主要探讨凸对偶性的基本概念,重点关注最通用且超级有用的 Fenchel-Rockafellar 对偶性,总结了如何将此对偶性应用于各种强化学习(RL)场景中,包括策略评估或优化、在线或离线学习,以及折现或未折现奖励。