Jan, 2022

安全感知的多智能体学徒学习

TL;DR本研究基于《Safety-Aware Apprenticeship Learning》的技术,提出了一种从单智能体学习框架到多智能体学习框架的延伸,并将这种延伸应用于逆强化学习模型,通过多智能体情景中的安全奖励函数提取,从而实现该模型的有效性和效率的提升。