Dec, 2023

用SAC解决Acrobot和Pendubot的摆动和平衡任务

TL;DR我们提出了一个基于强化学习算法的解决方案,用于在IJCAI 2023的人工智能奥林匹克竞赛中完成摇摆和平衡任务,基于Soft Actor Crtic (SAC)算法训练摇摆和进入线性二次调节器(LQR)控制器吸引区域的策略来稳定双摆杆处于顶部位置,我们的控制器在性能和鲁棒性方面实现了竞争分数,适用于pendubot和acrobot问题场景。