Feb, 2023

基于深度强化学习的曳杆目标多智能体检测

TL;DR本研究提出了一种用于自主、鲁棒、去中心化的旋转目标多智能体检查的层次学习方法。采用深度强化学习训练高水平计划器和导航计划器处理点对点导航,对于未知目标几何形状和来自传感器输入的更高保真度的信息论目标,此方法可拓展至鲁棒策略,并在受限信息下成功地检查超过 90% 的非凸旋转目标。