AAAIOct, 2021
分散合作匪徒团队中的合作伙伴感知算法
Partner-Aware Algorithms in Decentralized Cooperative Bandit Teams
Erdem Bıyık, Anusha Lalitha, Rajarshi Saha, Andrea Goldsmith, Dorsa Sadigh
TL;DR通过在多智能体协作中引入 Partner-Aware 策略,我们提出了一种去中心化的多臂赌博问题并进行了分析,理论和实验表明该策略实现了对数遗憾,并且能够在人工智能和人机合作中获得较好的表现。