Feb, 2025

通过自我对弈扩展构建可靠的模拟驾驶代理

TL;DR本研究解决了模拟代理在与人类交互系统中可靠性的挑战,尤其是自动驾驶车辆。通过在Waymo开放运动数据集上大规模自我对弈训练,研究者使代理在避免碰撞和偏离道路的情况下,完成99.8%的目标,展示了高效的泛化能力和在不同场景中的鲁棒性。这一方法显著提升了模拟驾驶代理的可靠性,并为实际应用提供了潜在影响。