Feb, 2022

RL-PGO:基于强化学习的平面姿态图优化

TL;DR本研究提出了一种基于深度强化学习(DRL)的 2D 姿态图优化的环境和代理,将姿态图优化问题建模为部分可观察的马尔可夫决策过程,并评估了性能。实验结果表明,拥有该方法的迭代式求解器可以产生质量更高的姿态估计,因此,我们相信基于强化学习的 PGO 是进一步加快研究朝向全局最优算法的有前途的途径。