Sep, 2022

数据增强下的统一状态表示学习

TL;DR该论文提出了一种使用数据增强进行统一状态表示学习的强化学习通用化方法,可以提高智能体的泛化能力和领域自适应性能在DeepMind控制泛化基准测试中的表现, 达到了更高的样本效率和14.3%的领域适应性比最佳基准结果。