Feb, 2024

通过协作 LLM-Agent 实现自动驾驶中的可编辑场景模拟

TL;DRChatSim 是第一个通过自然语言指令和外部数字资产实现可编辑的照片级 3D 驾驶场景模拟的系统,它利用大型语言模型 (LLM) 代理协作框架实现了高命令灵活性的编辑,并采用了新颖的多摄像机神经辐射场方法以实现逼真的结果,还借助了新颖的多摄像机光照估计方法以实现场景一致的资产渲染,实验证明 ChatSim 能处理复杂的语言指令并生成相应的逼真场景视频。