AdaAugment:一种无需调优的自适应数据增强方法
本文提出一种新的数据增强算法——Population Based Augmentation(PBA)——来生成非静态的增强策略日程表,相比于目前最先进的方法AutoAugment,PBA在 CIFAR-10、CIFAR-100 和 SVHN 数据集上耗费的总计算资源少三个数量级,但性能相当。在CIFAR-10数据集上,我们实现了1.46%的平均测试误差,稍微优于当前的最先进水平。
May, 2019
本文提出了一种可微分的策略搜索方法,用于数据增强,该方法比之前的方法更快,使用的是离散参数变换的近似梯度和可分辨操作选择机制。我们的方法通过最小化增强数据与原始数据之间的分布距离来优化,比之前的工作实现了显著更快的搜索,而不会出现性能下降。
Nov, 2019
本文通过比较三种方法,探究如何寻找适当的数据增强方式,并结合两个新的正则化项,以理论上的方式为某些 actor-critic 算法的数据增广提供支持,最终在 Procgen 基准测试上展示了在相对于标准 RL 算法提高了 ~40% 的测试性能。我们的代理优于其他针对 RL 中泛化改进的基线。此外,我们还展示了我们的代理学习出更能适应环境变化的策略和表示,包括不保留背景信息的变化。
Jun, 2020
本文提出了SOft Data Augmentation(SODA)方法,通过在编码器上施加约束,最大化增强和非增强数据的潜在表示之间的互信息,从而提高强化学习的样本效率、泛化能力和稳定性,实验表明该方法显著优于最先进的基于视觉的RL方法。
Nov, 2020
本文提出了一种更细致的自动数据增强方法,称为Patch AutoAugment,它能够在局部区域内寻找最佳数据增强策略,并通过多智能体强化学习协作实现对整张图片的优化增强效果,实验结果表明,该方法在多个基准数据集上具有比其他最新数据增强方法更好的性能表现,且需要更少的计算资源。
Mar, 2021
本文探究了数据增强技术在视觉强化学习中的有效性,研究数据增强的相关特征对样本效率的影响并提出了新的操作方法 Random PadResize 和循环增强(Cycling Augmentation)以提高样本利用效率。在DeepMind控制套件和CARLA驾驶模拟器上的广泛评估表明,与先前的最先进方法相比,我们的方法实现了更好的样本效率。
May, 2023
数据扩增在强化学习任务中提高数据效率的实验研究中起关键作用,增加状态-动作覆盖范围对数据效率的影响明显大于奖励密度的增加,同时减少扩增回放比显著提高数据效率。
Oct, 2023
各种数据增强技术在基于图像的深度强化学习中已被提出。通过分析现有方法,我们可以更好地理解它们及其不同组件的效果,并确定如何更好地利用数据增强。此分析表明了如何通过选择不同的数据增强变换来计算目标 Q 值,以更加有原则地利用数据增强。此外,我们提出了一种名为切线传递(tangent prop)的正则化项,在若干领域中验证了我们的论点,并且与不同基准模型相比,在大多数环境中取得了最先进的性能,并在某些复杂环境中展现了更高的样本效率和更好的泛化能力。
Feb, 2024