Jan, 2023

PECAN: 利用政策集成实现上下文感知的零-shot人工智能协同

TL;DR该论文提出了零样本人工智能与人类协作的新方法,使用策略组合方法以提高参与者的多样性,以及上下文感知方法使自我代理能够分析和识别合作伙伴的潜在策略原语以便其可以相应地进行不同的行为。结果表明,该方法在所有场景中实现了最先进的性能。