Mar, 2024

人群导航的混合策略纳什均衡

TL;DR用简单的迭代贝叶斯更新方案证明了混合策略纳什均衡模型收敛于混合策略社交导航游戏的纳什均衡,并提出了一个基于数据驱动的框架,该框架通过将代理策略初始化为从人类数据集中学得的高斯过程来构建游戏。基于提出的混合策略纳什均衡模型,我们开发了一个基于采样的群体导航框架,可以集成到现有的导航方法中,在笔记本电脑的 CPU 上实时运行。我们在模拟环境和非结构化环境中的真实人类数据集上评估了我们的框架,其在安全性和导航效率方面始终优于非学习和基于学习的方法,并在元规划之上达到了人类水平的群体导航性能。