Jul, 2023

基于不确定性感知的基础动作转换:用于交通信号控制的模拟到实际转换

TL;DR本文提出了一种名为 UGAT 的仿真到真实世界转移方法,通过动态转换模拟中的不确定行动来减小转移动态的领域差异,从而将在仿真环境中训练的学习策略转移到真实环境中,显著提高了转移强化学习策略在真实世界中的性能。