Feb, 2024

自动编码贝叶斯逆博弈

TL;DR基于贝叶斯观点和变分自编码器,提出一种解决交互式运动规划中的逆游戏问题的方法,通过构建后验分布来量化未知参数的不确定性,并且在处理连续、多模态分布时具有高效性。在模拟驾驶场景中的广泛评估中表明,该方法成功学习先验和后验目标分布,相比 MLE 基准,提供更准确的目标估计,从而促进更安全、更高效的博弈论运动规划。