Jun, 2024

REvolve: 大型语言模型在自动驾驶中的奖励进化

TL;DR利用大型语言模型来设计人类对鼓励功能的反馈机制,从而更好地训练自主驾驶系统。