BriefGPT.xyz
Ask
alpha
关键词
pseudo-counts
搜索结果 - 2
ICML
使用奇异值分解的深度强化学习表示与探索
该研究论文介绍了一个基于奇异值分解的方法,用于在领域中保留基础转换结构的表示,从而提供伪计数的估计,在多任务中展示了结果,并解决了部分可观测的环境下的难以探索的任务。
PDF
a year ago
基于状态抽象的近似探索
研究强化学习中探索和近似之间的相互作用,提出一种基于密度建模的方法来改善探索,探讨伪计数奖励在此方法中的应用,发现了在其应用中可能存在的过度或不足探索问题,并提出一种新的伪计数奖励来缓解这些问题。
PDF
6 years ago
Prev
Next