视觉强化学习中数据增强的全面调查
本文探究了数据增强技术在视觉强化学习中的有效性,研究数据增强的相关特征对样本效率的影响并提出了新的操作方法 Random PadResize 和循环增强(Cycling Augmentation)以提高样本利用效率。在 DeepMind 控制套件和 CARLA 驾驶模拟器上的广泛评估表明,与先前的最先进方法相比,我们的方法实现了更好的样本效率。
May, 2023
数据扩增在强化学习任务中提高数据效率的实验研究中起关键作用,增加状态 - 动作覆盖范围对数据效率的影响明显大于奖励密度的增加,同时减少扩增回放比显著提高数据效率。
Oct, 2023
各种数据增强技术在基于图像的深度强化学习中已被提出。通过分析现有方法,我们可以更好地理解它们及其不同组件的效果,并确定如何更好地利用数据增强。此分析表明了如何通过选择不同的数据增强变换来计算目标 Q 值,以更加有原则地利用数据增强。此外,我们提出了一种名为切线传递(tangent prop)的正则化项,在若干领域中验证了我们的论点,并且与不同基准模型相比,在大多数环境中取得了最先进的性能,并在某些复杂环境中展现了更高的样本效率和更好的泛化能力。
Feb, 2024
本研究提出了一种名为 Reinforcement Learning with Augmented Data 的加强数据的强化学习算法,将图像数据进行数据增强、使用深度神经网络等算法,提取出了数据效率、推广性等方面的关键特征。实验结果表明,该算法可以在 DeepMind 和 OpenAI Gym 等常见测试用例中优于当前最先进的算法。
Apr, 2020
本文通过比较三种方法,探究如何寻找适当的数据增强方式,并结合两个新的正则化项,以理论上的方式为某些 actor-critic 算法的数据增广提供支持,最终在 Procgen 基准测试上展示了在相对于标准 RL 算法提高了~40% 的测试性能。我们的代理优于其他针对 RL 中泛化改进的基线。此外,我们还展示了我们的代理学习出更能适应环境变化的策略和表示,包括不保留背景信息的变化。
Jun, 2020
本文介绍了深度学习算法在计算机视觉任务中的性能表现,以及数据增强技术对应对过拟合问题的应用。在这篇文章中,我们提供了数据增强技术的背景知识和综述,通过对现有的数据增强技术进行分类和比较,从而指导研究者选择适合自己的方法。我们还研究了数据增强技术的综合效果,得出结论可以显著提升图像分类、目标检测和语义分割的性能,我们提供了代码用于结果复现,并探讨了该领域未来的研究方向与挑战。
Jan, 2023
通过引入有效课程学习策略(ECL)来提高基于数据增强的视觉问答(VQA)方法,以缓解语言偏见,并通过生成额外的训练样本超出原始样本帮助消除偏见。与整个增强数据集的训练相比,我们的 ECL 策略可以通过使用更少的训练样本来进一步提高 VQA 模型的性能。
Jan, 2024