Dec, 2018

通用后继特征逼近器

TL;DR我们提出了一种新型的普适继承特征逼近器,利用其可进行上下文下多种策略迁移与推论,提高了强化学习算法的鲁棒性和实用性,并在一款首人称三维环境导航应用上展示了其广泛适用性。