Mar, 2024

SRLM:基于大型语言模型和深度强化学习的人机交互社交机器人导航

TL;DR我们提出了一种新的混合方法,称为社交机器人规划器 (SRLM),它将大型语言模型 (LLM) 和深度强化学习 (DRL) 相结合,以在人满为患的公共场所为人们提供多种社交服务。SRLM 通过实时人类指令推断全局规划,并将社交信息编码到基于 LLM 的大型导航模型 (LNM) 中进行低层运动执行。此外,设计了一种基于 DRL 的规划器来保持基准性能,通过大型反馈模型 (LFM) 与 LNM 融合,以解决当前文本和 LLM 驱动的 LNM 的不稳定性。最后,SRLM 在广泛的实验证明表现出色。