BriefGPT.xyz
Ask
alpha
关键词
hades
搜索结果 - 3
图像是对齐的弱点:利用视觉漏洞对跨模态大型语言模型进行越狱
研究了多模态大型语言模型(MLLMs)的无害对齐问题,通过对代表性 MLLMs 的无害性能进行系统的实证分析,揭示了图像输入对 MLLMs 的对准易受攻击的弱点。在此基础上,提出了一种名为 HADES 的新型越狱方法,利用精心制作的图像隐藏
→
PDF
4 months ago
HADES:基于本地度量比较的快速奇异性检测
Hades 是一种无监督算法,可通过核拟合度检验快速而可扩展地检测数据中的奇点。通过应用微分几何和最优传输理论,我们证明当数据样本生存在等维度流形的横交集上时,Hades 能够以很高的概率正确地检测奇点。在计算实验中,Hades 在合成生成
→
PDF
8 months ago
HADES: 同源自动文档探索和摘要
HADES 是一种自动文档比较工具,通过主题建模、文摘、关键词分析等多个步骤,使政策文件、法律法规和科学论文等大规模文献比较工作更加高效,同时具有交互式的 Web 应用程序和可视化功能,可公开访问 GitHub。
PDF
a year ago
Prev
Next