May, 2023

序列无关的多物体导航

TL;DR利用深度强化学习模型,基于无序的 actor-critic 框架和适当的奖励规范,提出了一个适用于多目标导航的机器人的算法,通过实验验证了这个方法在实践应用中胜过了预设顺序的方法和当下最先进的单个目标导航的方法。