Aug, 2024

KnowPC:基于知识的编程强化学习用于零-shot协作

TL;DR本研究解决了在合作AI领域中,零-shot协调(ZSC)面临的挑战,尤其是如何使智能体在未见过的环境中与新伙伴合作。提出的KnowPC方法通过可解释的程序表示智能体的策略,利用知识驱动的程序化强化学习来克服神经网络的缺乏可解释性和逻辑性的问题,显著提升了政策的可理解性和泛化能力。