软数据增强在强化学习中的泛化
本文研究机器学习领域中的强化学习问题,主要关注于学习能够适应不同环境的策略,探讨数据增强、元学习和对抗训练三种可能的策略泛化方法,发现数据增强方法是有效的,并研究了元学习和对抗学习作为替代的任务不可知方法的潜力。
Sep, 2018
本文研究了深度强化学习中的过拟合问题,并使用程序生成的环境来构建不同的训练和测试集,其中引入了一个名为CoinRun的新环境,用作强化学习中泛化的基准。使用CoinRun,作者发现代理程序会对相当大的训练集过拟合,还展示了更深层次的卷积体系结构以及传统监督学习中的方法,包括L2正则化,dropout,数据增强和批标准化等,能够提高泛化能力。
Dec, 2018
本研究提出了一种名为Reinforcement Learning with Augmented Data的加强数据的强化学习算法,将图像数据进行数据增强、使用深度神经网络等算法,提取出了数据效率、推广性等方面的关键特征。实验结果表明,该算法可以在DeepMind和OpenAI Gym等常见测试用例中优于当前最先进的算法。
Apr, 2020
本文通过比较三种方法,探究如何寻找适当的数据增强方式,并结合两个新的正则化项,以理论上的方式为某些 actor-critic 算法的数据增广提供支持,最终在 Procgen 基准测试上展示了在相对于标准 RL 算法提高了 ~40% 的测试性能。我们的代理优于其他针对 RL 中泛化改进的基线。此外,我们还展示了我们的代理学习出更能适应环境变化的策略和表示,包括不保留背景信息的变化。
Jun, 2020
该论文提出了一种使用数据增强进行统一状态表示学习的强化学习通用化方法,可以提高智能体的泛化能力和领域自适应性能在DeepMind控制泛化基准测试中的表现, 达到了更高的样本效率和14.3%的领域适应性比最佳基准结果。
Sep, 2022
本文提供了关于数据扩增在视觉强化学习中应用的广泛评论。作者提出了一个统一的框架,研究了数据扩增技术在视觉强化学习中的作用,并提供了一些方法来更好地利用扩增数据。最后,作者还通过系统的实证评估,总结了本文的研究内容及未来研究工作的展望。
Oct, 2022
本文探究了数据增强技术在视觉强化学习中的有效性,研究数据增强的相关特征对样本效率的影响并提出了新的操作方法 Random PadResize 和循环增强(Cycling Augmentation)以提高样本利用效率。在DeepMind控制套件和CARLA驾驶模拟器上的广泛评估表明,与先前的最先进方法相比,我们的方法实现了更好的样本效率。
May, 2023
数据扩增在强化学习任务中提高数据效率的实验研究中起关键作用,增加状态-动作覆盖范围对数据效率的影响明显大于奖励密度的增加,同时减少扩增回放比显著提高数据效率。
Oct, 2023