Apr, 2022

本地特征交换在强化学习中的泛化

TL;DR通过加入通道一致的局部置换技术(CLOP)作为一种新的规则化技术,以解决给模型造成的视觉泛化问题,该技术得到了验证,在 OpenAI Procgen 基准测试中,使用 CLOP 方法训练的强化学习代理比使用其他最先进技术的代理表现出更好的泛化能力。