May, 2024

强化学习基于能见度低环境中逃生路径生成

TL;DR通过使用激光雷达测绘系统,结合声纳和烟雾浓度数据,本文提出了一种实时确定消防人员搜索路径和平民撤离路径的系统,通过对独立点云数据的合并和简化,以及根据温湿度数据为每个节点标注危险分数,建立了一个环境张量,并通过线性函数逼近基于自然政策梯度强化学习方法,证明其在鲁棒性和速度方面优于更复杂的竞争方法,最后,提出了两个系统(救助者和难民)用于处理环境张量,分别创建安全救援和逃生路线。