security vulnerabilities | BriefGPT

关键词security vulnerabilities

搜索结果 - 53

分析型越狱攻击对大型语言模型的研究
我们进一步探索了大型语言模型在监狱破解攻击方面的边界，并提出了基于分析的监狱破解（ABJ）方法。通过在各种开源和闭源大型语言模型上进行详细评估，我们的研究展示了基于分析的监狱破解的攻击效果和效率的最新成果。我们的研究强调了优先考虑和增强大型
PDF4 days ago
MMArondight：使用自动生成的多模态越狱提示对大型视觉语言模型进行红队演练
利用 Large Vision Language Models (VLMs) 来增强和扩展 Large Language Models (LLMs) 的感知能力，引发了对生成有害内容的安全和伦理问题的关注。为了解决这一问题，我们引入了专门为
PDF6 days ago
ICML模型划图：评估对基于语言模型的编程助手的对抗攻击的影响
LLM-based 编程助手可以加快编程速度，但可能引入更多安全漏洞。我们介绍了恶意编程提示（MaPP）攻击，通过向编程任务的提示中添加少量文本（小于 500 字节），我们展示了我们的提示策略如何使 LLM 在编写其他正确代码的同时添加漏洞
PDF15 days ago
eyeballvul：野外漏洞检测的未来验证基准
利用 LLMs 对代码库中的安全漏洞进行检测，介绍了一个基于人工评估的大规模漏洞检测基准，该基准每周从开源代码库中发布的漏洞中进行源和更新，如今包含超过 24,000 个漏洞、6,000 个修订版本和 5,000 个代码库，并达到 55GB
PDF16 days ago
智能合约中的漏洞检测：综合调查
通过对机器学习技术和智能合约的交叉研究，本文填补了现有文献中的重要空白，揭示了机器学习技术在智能合约安全漏洞检测和缓解中的潜力，并提供了当前方法的综合和探索方向的洞见。
PDF19 days ago
您的 AI 生成代码真的安全吗？基于 CodeSecEval 的安全代码生成对大型语言模型的评估
大规模语言模型（LLMs）在代码生成和修复方面取得了重大进展，但它们使用来自 GitHub 等开源存储库的未经过滤的数据进行训练可能会传播安全漏洞。本文旨在全面评估和增强代码 LLMs 的安全性，并提出了不同策略来减轻这些安全漏洞。
PDF25 days ago
被污染的 LangChain: LangChain 破解 LLMs
通过 LangChain 实现 Retrieval-Augmented Generation，我们提出了间接破解和一种新的间接破解攻击方法 ——Poisoned-LangChain (PLC)，该方法使用毒化的外部知识库与大型语言模型进行交
PDFa month ago
对大型语言模型的后门攻击和防御调研：对安全措施的影响
该研究论文侧重于细调方法，系统地将后门攻击分类为全参数细调、参数高效细调和无细调攻击，并讨论了未来研究中关键问题，例如无需细调的攻击算法和更隐蔽的攻击算法，以填补现有后门攻击调查的知识空白。
PDF2 months ago
AutoBreach: 通用和自适应的越狱技术与高效的文字指导优化
通过 AutoBreach 方法生成映射规则来打破大型语言模型的安全防御机制，以识别安全漏洞并提高破解成功率。
PDF2 months ago
AI 风险管理应同时考虑安全与保障
介绍了 AI 安全和 AI 安全漏洞之间的相互作用，讨论了定义上的不一致和缺乏共识，并引入一个统一的参考框架来澄清 AI 安全和 AI 安全之间的差异和相互作用，旨在促进不同社区之间的共识和有效合作。
PDF2 months ago
跨模态越狱与医疗多模态大语言模型的不匹配攻击
介绍了 MedMLLMs（医学环境下的多模态大型语言模型）的安全漏洞，并提出了两种攻击类型（2M-attack 和 O2M-attack），并通过构建 3MAD 数据集进行评估，指出即使设计具有增强安全功能的 MedMLLMs 也存在安全漏
PDF2 months ago
CVPR物理后门：面向物理世界的基于温度的后门攻击
该研究首次在物理和数字领域中研究与热红外物体检测相关的后门攻击的安全漏洞，并介绍了两种新型的后门攻击类型：物体影响攻击和范围影响攻击。通过对温度、尺寸、材料和隐藏等关键因素的全面分析，特别是温度的影响，揭示了后门攻击对热红外物体检测的有效性
PDF3 months ago
ICLR大型语言模型的第三方 API 攻击
本研究提出了一种新的攻击框架，旨在检验第三方 API 与大型语言模型平台的安全漏洞，通过对广泛使用的大型语言模型进行实证分析，发现了可悄无声息地修改模型输出的实际恶意攻击，探讨了第三方 API 集成带来的独特挑战，并提出了未来改善大型语言模
PDF3 months ago
LLMs 在 Web 开发中：评估 LLM 生成的 PHP 代码揭示的漏洞和局限性
该研究通过分析一组包含 2,500 个小型动态 PHP 网站的数据集，全面检查了大型语言模型生成的 Web 应用程序代码安全性。评估了这些部署为独立网站的人工智能生成网站中的安全漏洞，并采用了 Burp Suite 主动扫描器、静态分析和手
PDF3 months ago
JailbreakLens：针对大型语言模型的越狱攻击的可视化分析
通过与领域专家合作，我们提出了一个辅助框架来简化对繁琐的破解分析过程，并设计了一个视觉分析系统，帮助用户评估模型安全性并识别模型弱点。
PDF3 months ago
ACL多语言机器翻译的后门攻击
多语言机器翻译系统存在安全漏洞，通过在低资源语言对中注入毒数据，可以在其他语言中引发恶意翻译，攻击成功率达到 20%。这种攻击方式对低资源语言具有更大的攻击面，希望引起人们对机器翻译系统的安全问题的重视，尤其是在低资源语言环境中。
PDF4 months ago
LLM 安全风险评估：全面的利益相关方风险评估方案
利用 OWASP 风险评估方法，通过场景分析确定潜在威胁者并将系统组成部分与漏洞因素进行映射，从而评估网络攻击的可能性，并进一步进行综合影响分析以得出威胁矩阵，以提供对 LLM 相关风险的全面评估，帮助利益相关者制定有效的缓解策略。
PDF4 months ago
WWWJavaScript 程序中基于大规模语言模型的漏洞修复研究
本研究探讨了 ChatGPT 和 Bard 这两个大型语言模型在发现和修复 JavaScript 程序中的安全漏洞方面的准确性，以及提示语境对定位 LLMs 生成正确补丁的影响。实验结果显示，虽然 LLMs 在自动修复 JavaScript
PDF4 months ago
EasyJailbreak：面向大型语言模型的统一越狱框架
EasyJailbreak 是一个统一的框架，简化了对大型语言模型的越狱攻击的构建和评估，支持 11 种不同的越狱方法，并揭示了各种越狱攻击下 10 种不同语言模型的平均漏洞概率为 60%，GPT-3.5-Turbo 和 GPT-4 的平均
PDF4 months ago
利用线性逻辑方法进行软件漏洞和功能评估
通过研究使用大型语言模型（LLMs）在代码审查中的作用，其中包括检测安全漏洞和验证软件功能的有效性，本文发现大型专有模型在这些任务上的性能显著优于小型开源模型，并证明了 LLMs 能够生成与真实漏洞相关的详细描述。
PDF4 months ago