BriefGPT.xyz
Ask
alpha
关键词
total variation reward
搜索结果 - 1
未知环境下在线覆盖路径规划的端到端强化学习
该研究提出了基于强化学习的、连续状态和动作空间下的在线覆盖路径规划方法,用于处理未知环境的大型区域,并且结合了全局地图和局部感知输入,以及多尺度地图输入表示的观测空间构建,通过提出的全变差奖励,实现了学习路径上无漏洞被覆盖的目标。
PDF
a year ago
Prev
Next