Feb, 2024

通过深度强化学习实现现实世界流体引导刚体控制

TL;DR近期增加在强化学习实际应用方面的研究,依赖于能够在规模上准确模拟系统。然而,液体动力学系统等领域展示了复杂的动态现象,难以以高积分速率进行模拟,限制了现代深度强化学习算法在昂贵或安全关键硬件上的直接应用。在本研究中,我们引入了 “Box o Flows”,这是一个新颖的台面实验控制系统,用于系统地评估动态实际环境中的强化学习算法。我们描述了 Box o Flows 的关键组成部分,并通过一系列实验演示了最新的无模型强化学习算法如何通过简单的奖励规范来合成各种复杂行为。此外,我们通过重用过去的经验,探讨了离线强化学习在数据高效假设测试中的作用。我们相信,从这个初步研究中获得的见解以及像 Box o Flows 这样的系统的可用性,将支持开发可普遍应用于复杂动态系统的系统化强化学习算法。附加材料和实验视频可在以下链接找到:[URL]