ICMLNov, 2017

在模拟和真实的路口传递自动驾驶知识

TL;DR本文探讨了自主车辆交叉路口处理的强化学习问题,并研究了其在转移学习情况下的行为。研究发现,对于不同的路口,同一种训练网络通常无法推广。然而,一个在一个十字路口上训练过,并在另一个路口上微调过的网络,相较于孤立训练,能更好地进行新任务。此外,本文还论证了对于将模拟交叉口处理知识从计算机模拟环境传递到实际自主车辆时,微调的好处。