Dec, 2023

多智体基于偏好的强化学习在人工智能团队合作中的基准测试

TL;DR人机协作中基于偏好的强化学习(PbRL)是一个活跃的研究领域,并在单个代理人和观察者在环路场景中取得了显著的进展。然而,在人机合作的多代理强化学习框架中,在人类积极参与并表达对代理行为偏好的应用仍然是未知的。