Jun, 2024

在湍流中游泳的物理信息评论家型演员-评论家强化学习

TL;DR通过开发和比较一种新的物理知情强化学习策略,我们研究了维持颗粒与其被从被动运动中推动的近邻保持接近的所需游动努力。该策略采用了将神经网络参数化的评论家替换为一个解析导出的物理启发式函数(物理学家)的Actor-Physicist算法,并与解析计算的最优预设控制策略和标准物理不可知的Actor-Critic类型算法进行了比较。