BriefGPT.xyz
Ask
alpha
关键词
visual model-based rl
搜索结果 - 1
RePo: 通过正则化后验可预测性提高强化学习模型的弹性
这篇论文提出了一种视觉模型驱动的强化学习方法,它学习到了一个对噪声和干扰具有弹性的潜在表示,通过鼓励表示能够最大程度地预测动态和奖励,并在观察和潜在表示之间限制信息流。此方法对于视觉干扰具有显著的抵抗力,在动态环境中能够有效运行。此外,作者
→
PDF
10 months ago
Prev
Next