Oct, 2024

基于欧几里得数据增强的强化学习在状态驱动的连续控制中的应用

TL;DR本研究解决了强化学习在连续控制中的数据效率问题,尤其是在状态驱动的控制场景下。作者提出了一种基于欧几里得对称性的创新数据增强方法,该方法通过对肢体配置特征进行变换,显著提高了数据效率和最终性能。研究显示,这种新方法在多种连续控制任务中表现优异,具有重要的应用潜力。