Dec, 2022

动力总成控制的残差策略学习

TL;DR本文介绍一种主动驾驶辅助方法,使用剩余策略学习代理人来提供剩余操作以平衡燃料消耗和其他驾驶员适应性目标。通过实施在各种车辆尾随情境下的模拟商用车上,我们发现与基线源策略相比,剩余策略学习代理人很快学习到了显着改进的策略,但在某些方面不如从头开始训练的强化学习代理人所能达到的最终结果。