Jan, 2023

强化学习中的策略转移的小样本图像到语义翻译

TL;DR本研究探讨采用图像到语义翻译技术进行政策传递,缓解基于视觉的机器人控制代理的学习困难问题。通过学习从图像到语义的映射,我们可以将在模拟器中预先训练的政策传递到现实世界中,从而消除学习花费和风险高的现实世界上策略的实时交互学习。此外,使用图像到语义映射在训练策略时具有计算效率和可解释性优势。我们提出了两种技术:在模拟器环境中使用转换函数的配对增强技术和主动学习,以解决图像到语义映射中的主要困难,即为产生训练数据的人工注释成本。我们观察到注释成本的降低,而传递的性能不会下降。因此,所提出的方法优于现有的未经注释的方法。