Jul, 2024

机器人个性的美德:个性与LLM安全的关系

TL;DR人格心理学家分析了人类社会中人格与安全行为之间的关系。本研究旨在发现大型语言模型(LLMs)的个性特征与其安全能力之间的紧密关联,并通过MBTI-M规模发现了毒性、隐私和公平性等个性特征。此外,研究还发现不同个性特征的LLMs对越狱有不同的易感性。通过从ISTJ到ISTP的个性诱导,隐私和公平性能相对提高了约43%和10%。这项研究开创性地从个性角度探讨了LLM安全性,为LLM安全性增强提供了新的见解。