Sep, 2023

学习在物体导航中终止

TL;DR该研究论文探讨了自主导航系统中目标导航的关键挑战,特别关注了深度强化学习(DRL)方法中长期最优轨迹的目标接近和结束问题。论文提出了一种新颖的方法,称为深度推理终止代理(DITA),它通过将一个监督模型称为判决模型与强化学习相结合来隐式推断目标的深度并决定结束。评估显示该方法在各个房间类型上取得了9.3%的成功率提升,并在长期轨迹环境上取得了51.2%的改进,同时保持稍好的路径长度加权成功率。