May, 2024

自然语言约束下的安全多智能体强化学习

TL;DR我们提出了一种名为SMALL的新方法,该方法利用经过微调的语言模型来解释和处理自由形式的文本约束,将其转化为捕捉禁止状态和行为本质的语义嵌入,并将其整合到多智能体策略学习过程中,使智能体能够学习最小化约束违规和优化奖励的策略。在多个环境中进行的实证评估显示,SMALL在理解和执行自然语言约束方面具有显著的效果,实现了可比较的奖励和显著减少的约束违规。