BriefGPT.xyz
Ask
alpha
关键词
deceptive information
搜索结果 - 2
欺骗性提示对多模态语言模型的迷惑程度实证分析
通过 Quantum-Bench,我们比较了多种先进模型在对抗伪信息的能力上的表现,并提出了通过增加伪信息以增强模型韧性的建议。
PDF
5 months ago
阿瓦隆的思想游戏:通过递归思考对抗欺骗
使用迷惑性信息鉴别和应对的新框架 Recursive Contemplation(ReCon)提高了大型语言模型在识别和操纵具有迷惑性信息方面的能力,测试使用了迷宫游戏 Avalon 进行了广泛实验,证明了 ReCon 的有效性,无需额外的
→
PDF
9 months ago
Prev
Next