Aug, 2022

使用数据正则化 Q-Learning 进行目标导航

TL;DR该研究使用深度强化学习方法,通过增量构建语义地图和选择长期目标来实现目标导航,并通过数据增强和 Q 函数正则化等方法明显提高了模型性能。