Mar, 2024

LLM强化驾驶员代理的驾驶风格对齐

TL;DR通过自然语言数据集和实验来对駕駛代理人行为与人类駕駛风格进行多重对齐,验证该框架能够为设计具有多种驾驶风格的驾驶代理人提供有价值的洞察。