Sep, 2022

跨领域适应性的受控行为模式多样性开放式解发现

TL;DR通过行为约束训练多样化策略,提高强化学习在不同环境下的泛化能力。