自然语言约束下的安全多智能体强化学习

May, 2024

自然语言约束下的安全多智能体强化学习

Safe Multi-agent Reinforcement Learning with Natural Language Constraints

Ziyan Wang, Meng Fang, Tristan Tomilin, Fei Fang, Yali Du

TL;DR我们提出了一种名为SMALL的新方法，该方法利用经过微调的语言模型来解释和处理自由形式的文本约束，将其转化为捕捉禁止状态和行为本质的语义嵌入，并将其整合到多智能体策略学习过程中，使智能体能够学习最小化约束违规和优化奖励的策略。在多个环境中进行的实证评估显示，SMALL在理解和执行自然语言约束方面具有显著的效果，实现了可比较的奖励和显著减少的约束违规。

Abstract

The role of natural language constraints in safe multi-agent reinforcement learning (MARL) is crucial, yet often overlooked. While Safe MARL has vast potential, especially in fields like robotics and autonomous v

发现论文，激发创造

自然语言引导的强化学习探索

本文介绍了一种使用自然语言帮助强化学习泛化至未知环境技术的方法，使用编码器-解码器网络来学习自然语言行为描述与状态-动作信息之间的关联，并使用改进的策略塑造算法来指导智能体探索，从而提高其在未知环境中的学习能力。通过对经典游戏Frogger的评价，表明我们的改进策略形态算法在优化学习上优于Q-Learning算法和基线策略形态算法。

Jul, 2017

针对智能代理人自然语言交流的定期策略优化

提出一个可以通过联合推理视觉观察和语言输入来学习自然语言指令的新型策略优化算法，该训练范式提供了有效的探索和更好的泛化能力，相比现有的集成模型，我们提出的最佳模型在块世界环境中的执行错误率可以大幅降低超过50％，同时还包括系统性的研究以展示我们RL算法的探索策略。

Jun, 2018

语言即力：在强化学习中使用自然语言表示状态

研究表明使用自然语言表征的强化学习代理比视觉代理更具鲁棒性，更快收敛，表现更好，展示出使用自然语言表征的好处。

Oct, 2019

机器人多目标强化学习中基于回顾的指令实现

本文提出使用机器人强化学习来学习自然语言目标表示的问题。通过提出回顾指令重播机制、seq2seq模型和基于语言的学习任务，解决了自然语言的组合性和触觉数据和行为之间的联系问题，并展示了学习性能的提高。

Apr, 2022

内部-外显任务语言发展与翻译驱动的自然语言指导下的强化学习

采用内部-外部模式的自然语言控制强化学习方法使用任务语言与谓词表示来学习多个断言以模拟对象关系，并将翻译器用于自然语言到任务语言的转换，有效地提高13.4%的成功率和适应性，并成为有效的任务抽象形式，与层次强化学习相容。

Feb, 2023

精细调整包容性语言模型的代理-环境接口破碎

本文提出了一种新的方法，将预训练的语言模型同时用作策略、奖励函数和转移函数，从而实现了奖励学习和语言模型微调的联合和直接处理，并通过处理认知不确定性来实现高效探索。

May, 2023

安全芯片插入：强制LLM驱动的机器人代理遵守限制

利用大型语言模型（LLM）所提供的世界知识和普遍推理能力，我们提出了一种基于线性时态逻辑（LTL）的可查询安全约束模块，用于在协作环境中部署LLM代理，并通过自然语言到时态约束编码、安全违规推理、不安全行为修剪等功能，实现了显式指示禁止行为、评估机器人对限制的理解，并确保其合规性。实验证明我们的系统可以严格遵守安全约束并能很好地适用于复杂的安全约束，具备实际应用潜力。

Sep, 2023

使用自由形式的自然语言约束和预训练语言模型的安全强化学习

利用预训练语言模型的先验知识，我们的方法可以在遵守给定约束条件的情况下，理解复杂约束并学习安全策略，而无需任何阶段的真实成本。

Jan, 2024

安全强化学习中的约束形式调查

基于约束条件的安全强化学习方法在实现安全优化代理策略方面发挥了重要作用，本研究综述了代表性约束形式以及专为每种形式设计的算法，并揭示了常见问题形式之间的数学相互关系，最后讨论了安全强化学习研究的现状和未来方向。

Feb, 2024

离线多智能体强化学习与安全约束的扩散模型

最近在多智能体强化学习（MARL）的进展中，其应用已扩展到各种安全关键场景。然而，大多数方法专注于在线学习，在实际环境中部署时存在重大风险。为了解决这一挑战，我们引入了一个创新的框架，将扩散模型与MARL范式相结合。通过风险缓解来增强多智能体采取的动作的安全性，并建模协同行动。我们的框架基于分散执行（CTDE）架构中的集中式训练，扩展了用于预测轨迹生成的扩散模型。此外，我们还结合了一种专门的算法来确保操作安全性。我们在DSRL基准测试上评估了我们的模型，并进行了对比实验。实验结果表明，我们的模型不仅符合严格的安全约束，而且在性能上优于现有的方法。这凸显了我们的方法在推动MARL在实际应用中的安全性和效能方面的潜力。

Jun, 2024