Sep, 2023

安全芯片插入:强制 LLM 驱动的机器人代理遵守限制

TL;DR利用大型语言模型(LLM)所提供的世界知识和普遍推理能力,我们提出了一种基于线性时态逻辑(LTL)的可查询安全约束模块,用于在协作环境中部署 LLM 代理,并通过自然语言到时态约束编码、安全违规推理、不安全行为修剪等功能,实现了显式指示禁止行为、评估机器人对限制的理解,并确保其合规性。实验证明我们的系统可以严格遵守安全约束并能很好地适用于复杂的安全约束,具备实际应用潜力。