Feb, 2022

凸形强化学习中的常见假设挑战

TL;DR本文针对凸强化学习中优化无限试验目标带来的近似误差问题展开研究,并指出这一问题将影响包括模仿学习在内的相关领域的方法和技术。