BriefGPT.xyz
Ask
alpha
关键词
visual distractions
搜索结果 - 4
MuDreamer: 无需重建学习预测性世界模型
MuDreamer 是一种强大的强化学习代理,它在 DreamerV3 算法的基础上通过学习一种无需重建输入信号的预测世界模型,改善了 Dreamer 在面对视觉干扰时感知关键元素的能力。
PDF
a month ago
序贯行为引发的不变表示在强化学习中的应用
通过序列动作导致不变表示法(SAR)方法,针对具有视觉干扰的高维观测中准确学习与任务相关的状态表示的问题,本文提出了一种能抵抗干扰的表示学习方法,通过编码器优化学习从而仅保留顺序动作控制信号后的组件,使得智能体能够学习到鲁棒的表示形式,并在
→
PDF
9 months ago
ICML
DRIBO: 多视角信息瓶颈下的鲁棒深度强化学习
本研究利用多视角设置引入对比的多视图信息瓶颈目标训练深度强化学习代理程序,从而可以学习到能够保留任务相关信息但压缩掉任务不相关信息的强大的表示,进而训练出具有鲁棒性和泛化性的高性能政策。
PDF
3 years ago
分心控制套件 - 基于像素的强化学习的挑战性基准测试
本文提出一种基于视觉的控制新的挑战性基准,用于分析在多种视觉干扰和复杂性环境下的强化学习算法,结果表明当前视觉控制强化学习方法在复杂性视觉干扰下表现不佳,需要新的方法来应对现实世界的视觉复杂性。
PDF
3 years ago
Prev
Next