Dec, 2016

将人类领域知识融入大规模成本函数学习

TL;DR本研究采用预先训练的方式将人类先验知识引入深度逆强化学习,实现了更高的鲁棒性,更明显的障碍物边界以及能够捕捉纯学习模型无法捕捉的障碍物实例,这使得最终的模型可以更准确地处理包括楼梯、坡道和地下通道在内的稀有案例。