ICMLJul, 2020

双向模型基策略优化

TL;DR本文提出了一种双向模型策略优化方法(BMPO),该方法通过构建正向和反向动力学模型来提高模型预测精度,从而实现更高的采样效率和渐进性能。