Dec, 2023

规模化即是所需:利用 JAX 加速强化学习训练自动驾驶强化策略

TL;DR通过大规模强化学习应用于自动驾驶,分析了在实验规模逐渐扩大时由此产生的策略表现以及对策略表现的主要影响因素。