Dec, 2023

增强上下文的观测多臂赌博机在不确定语义数据下的机器人探索

TL;DR对于不确定性下的机器人决策,必须谨慎考虑可利用选项的开发和探索之间的平衡。本研究介绍了一种新的上下文多臂赌博机变体,称为观察增强型 CMABs(OA-CMABs),其中决策代理可以利用来自外部信息源的额外结果观察。我们提出了一种基于概率数据验证概念的 OA-CMABs 鲁棒贝叶斯推理过程,用于处理 OA-CMABs 中的复杂混合模型参数先验和语义数据源的混合观察可能性,以及推理中的错误观察和非高斯推理。通过在空间探索的模拟异步搜索站点选择问题上演示,结果表明即使外部信息源提供不正确的观察,也可以在广泛的实验条件下实现高效的决策和鲁棒的参数推理。