Jun, 2020

使用不确定性估计的强化学习在交叉路口的战术决策中

TL;DR本研究探讨了如何使用贝叶斯强化学习方法和散置神经网络来解决交叉路口自主驾驶情景下的决策问题,训练出的系统可以估计可靠性并识别未知情境中的危险,其性能远超标准的基于深度 Q 网络的决策系统。