May, 2024

大型语言模型中非标准 Unicode 字符对安全和理解的影响

TL;DR通过比较分析十五个不同模型的表现,我们揭示了这些模型固有的脆弱性,挑战了它们人类级语言理解的观念,并探讨了非标准 Unicode 字符对 LLMs 的影响及其在最佳性能 LLMs 上的保护机制,包括 GPT-4、Gemini 1.5 Pro、LlaMA-3-70B 和 Claude 3 Opus。