May, 2024

视觉强化学习中无界数据增强的配方

TL;DR通过数据增强的广义方法 SADA,可以提高 Q-学习算法在视觉观察训练中的稳定性和泛化能力,适用于各种数据增强方式。