ICLRJan, 2024

连接状态与历史表征:理解自预测强化学习

TL;DR深度强化学习的关键是表示方法,这篇论文揭示了多种表示学习方法和理论框架之间的共同性,特别是基于自预测抽象的思想,并给出了学习自预测表示方法的最简算法和实用指南。