Jul, 2019

自动驾驶中的深度强化学习动态输入

TL;DR本文阐述了全连接神经网络,卷积神经网络和递归神经网络在处理变量大小输入的强化学习问题方面的局限性,提出了一种利用Deep Sets结构的离线决策方法,用于高层次决策,通过比较各种不同的可能性,表明Deep Sets不仅在总体表现上表现优异,而且在未见情况下呈现更好的泛化性。