BriefGPT.xyz
大模型
Ask
alpha
关键词
self-predictive abstraction
搜索结果 - 1
ICLR
连接状态与历史表征:理解自预测强化学习
深度强化学习的关键是表示方法,这篇论文揭示了多种表示学习方法和理论框架之间的共同性,特别是基于自预测抽象的思想,并给出了学习自预测表示方法的最简算法和实用指南。
PDF
5 months ago
Prev
Next