BriefGPT.xyz
Ask
alpha
关键词
malicious intent
搜索结果 - 2
图像是对齐的弱点:利用视觉漏洞对跨模态大型语言模型进行越狱
研究了多模态大型语言模型(MLLMs)的无害对齐问题,通过对代表性 MLLMs 的无害性能进行系统的实证分析,揭示了图像输入对 MLLMs 的对准易受攻击的弱点。在此基础上,提出了一种名为 HADES 的新型越狱方法,利用精心制作的图像隐藏
→
PDF
4 months ago
MM
电子邮件摘要以协助用户识别网络钓鱼
本文探讨了机器学习在分析邮件中的内容、检测潜在恶意和创建邮件摘要方面的应用,以帮助用户判断是否安全及自学习更高级的恶意模式。
PDF
2 years ago
Prev
Next