安全芯片插入：强制 LLM 驱动的机器人代理遵守限制

Sep, 2023

安全芯片插入：强制 LLM 驱动的机器人代理遵守限制

Plug in the Safety Chip: Enforcing Constraints for LLM-driven Robot Agents

Ziyi Yang, Shreyas S. Raman, Ankit Shah, Stefanie Tellex

TL;DR利用大型语言模型（LLM）所提供的世界知识和普遍推理能力，我们提出了一种基于线性时态逻辑（LTL）的可查询安全约束模块，用于在协作环境中部署 LLM 代理，并通过自然语言到时态约束编码、安全违规推理、不安全行为修剪等功能，实现了显式指示禁止行为、评估机器人对限制的理解，并确保其合规性。实验证明我们的系统可以严格遵守安全约束并能很好地适用于复杂的安全约束，具备实际应用潜力。

Abstract

Recent advancements in large language models (LLMs) have enabled a new research domain, llm agents, for solving robotics and →

large language models llm agents robotics planning tasks safety constraints

发现论文，激发创造

概念引导的 LLM 代理用于人工智能安全共设

通过定制化的大型语言模型 (LLM) 代理，采用提示工程、启发式推理和检索增强生成的元素，以保持结构化信息，我们提出了一种高效的混合策略，利用 LLM 进行安全分析和人工智能与人类的协同设计，以提高软件工程和安全工程中的生成式 AI 的质量要求，并确保人类对生成式 AI 提供的建议负责，通过图形表述作为系统模型的中间表示，促进了 LLM 和图形之间的交互，以简化的自动驾驶系统为案例说明了我们的方法。

Apr, 2024

约束流形上的安全强化学习：理论与应用

将基于学习的技术，特别是强化学习，整合到机器人技术中来解决非结构化环境中的复杂问题很具有前景。本文展示了我们如何以原则性的方式将复杂的安全约束强加于基于学习的机器人系统中，从理论和实践的角度进行了展示。

Apr, 2024

使用自由形式的自然语言约束和预训练语言模型的安全强化学习

利用预训练语言模型的先验知识，我们的方法可以在遵守给定约束条件的情况下，理解复杂约束并学习安全策略，而无需任何阶段的真实成本。

Jan, 2024

大语言模型自动驾驶的安全要求工程化

基于大型语言模型的原型管道可以在每次更新后自动细化和分解需求，还能对需求数据集进行审查，找出冗余或矛盾的需求，该研究通过多个迭代的设计科学，让不同公司的专家从定量和定性两个方面评估每个周期，最终在一个案例公司中实施了原型，并由负责团队评估其效率。

Mar, 2024

SLM 作为守护者：先驱性地利用小型语言模型进行人工智能安全

利用较小的大语言模型实现有害查询检测和安全响应，通过多任务学习机制融合两个任务到一个模型里，效果在公开的大语言模型上表现相当或超过有害查询检测和安全响应的性能。

May, 2024

ChatSOS: 基于 LLM 的安全工程知识问答系统

我们的研究通过引入以 LLM 为基础的问答系统，结合外部知识数据库，提高了模型的理解和响应准确性，有效地总结事故报告并提供相关建议，从而将 LLM 的应用拓展到安全工程领域，并为自动化智能系统的未来发展树立了先例。

Dec, 2023

LTLDoG：满足时间延伸的符号约束的安全扩散规划

基于有限线性时态逻辑（LTLf）的指令，本研究提出了一种数据驱动的扩散式框架（LTLDoG），用于在复杂环境中生成遵守新的静态和时间延伸的约束 / 指令的远景轨迹，并在机器人导航和操纵的实验中验证了其有效性。

May, 2024

基于 LLMs 和具有体现知识图谱的服务机器人的安全控制

通过将大型语言模型与具体机器人控制提示和具体知识图谱相结合，我们提出了一种新的集成方法，以增强服务机器人的安全框架，确保其行动与安全协议持续保持一致，并在各种情境下提供更安全的操作实践，从而促进安全的人机互动。

May, 2024

自然语言约束下的安全多智能体强化学习

我们提出了一种名为 SMALL 的新方法，该方法利用经过微调的语言模型来解释和处理自由形式的文本约束，将其转化为捕捉禁止状态和行为本质的语义嵌入，并将其整合到多智能体策略学习过程中，使智能体能够学习最小化约束违规和优化奖励的策略。在多个环境中进行的实证评估显示，SMALL 在理解和执行自然语言约束方面具有显著的效果，实现了可比较的奖励和显著减少的约束违规。

May, 2024

长短期约束驱动的安全强化学习在自动驾驶中的应用

提出一种基于长短期约束的安全强化学习算法，用于优化端到端自动驾驶的训练过程，实现连续状态和行动任务中更高的安全性和长距离决策任务中更高的探索性能。

Mar, 2024