BriefGPT.xyz
Ask
alpha
关键词
state entropy
搜索结果 - 2
ICML
行为对比学习:无监督技能发现
本文提出了一种基于对比学习的无监督技能发现方法,通过得到相似的行为来表征同一种技能, 并使得不同技能产生不同的行为,同时增加状态熵以获得更好的状态覆盖率,实验结果表明,该方法能够产生各种远程技能,并在下游任务中达到有竞争力的表现。
PDF
a year ago
ICML
利用随机编码器最大化状态熵以进行高效探索
本文介绍了一种基于状态熵作为内在奖励的随机编码器(Random Encoders for Efficient Exploration,RE3)的探索方法,旨在解决高维观察空间中的有效探索问题,并在 DeepMind Control Suit
→
PDF
3 years ago
Prev
Next