BriefGPT.xyz
Ask
alpha
关键词
sample efficient learning
搜索结果 - 2
学习教学:提高师生学习中的样本效率,用于模拟到真实场景的迁移
模拟到现实的迁移是机器人学习的一个基本问题,本文提出了一种学习框架,通过引入师生学习范式和样本高效性,解决了培训中噪声观测造成的困难,实现了模拟环境下机器人的高性能表现。
PDF
5 months ago
强化学习的信息理论状态变量选择
在本论文中,我们介绍了一种用于强化学习(RL)的信息论准则 Transfer Entropy Redundancy Criterion (TERC),该准则确定了训练过程中是否从状态变量到动作变量传递了信息熵。基于 TERC 的算法能够排除
→
PDF
6 months ago
Prev
Next