Feb, 2023

Re$^2$H2O: 基于反向正则化的混合离线和在线强化学习的自动驾驶场景生成

TL;DR利用反向正则化混合离线 - 在线强化学习模型同时学习真实世界和模拟数据来生成自动驾驶测试场景,实现更高效的 AV 测试和更准确的风险评估。