Aug, 2022
使用数据正则化 Q-Learning 进行目标导航
Object Goal Navigation using Data Regularized Q-Learning
Nandiraju Gireesh, D. A. Sasi Kiran, Snehasis Banerjee, Mohan Sridharan, Brojeshwar Bhowmick...
TL;DR该研究使用深度强化学习方法,通过增量构建语义地图和选择长期目标来实现目标导航,并通过数据增强和 Q 函数正则化等方法明显提高了模型性能。