- 评估 200 + 定制 GPT 的提示注入风险
本文提供了一份对 AI 自定义 GPT 模型中提示注入的分析,并评估了此类攻击的可能缓解措施,结果强调了在设计和部署可定制的 GPT 模型时迫切需要强大的安全框架,以确保 GPT 定制化的好处不会以安全和隐私的牺牲为代价。
- LLM 能否修复安全问题?
使用静态代码分析工具 Bandit 的反馈驱动解决方案综合(FDSS)对大型语言模型(LLMs)进行改进,通过与 LLMs 交互生成潜在解决方案来修复安全漏洞,该方法在基准测试中显著改善并超过现有方法,并引入了新的 PythonSecuri - SecurityNet: 评估公共模型的机器学习漏洞
将公共模型用于评估机器学习模型的攻击和防御方法,表明这些攻击 / 防御方法在公共模型上的表现与自行训练的模型存在显著差异。
- 针对对齐语言模型的对抗攻击的基线防御
大型语言模型的安全漏洞对其进行了深入理解。最近的研究表明,文本优化器可以产生绕过审核和对齐的越狱提示。我们从对抗机器学习的丰富研究基础中提出三个问题:在这个领域中,哪些威胁模型实际上是有用的?基线防御技术在这个新领域中的表现如何?LLM 安 - 针对无法听见的语音激活设备的对抗性代理
通过对无声攻击进行的分析,我们确认安全风险因素为 7.6(满分为 10),突显了 NIST 国家漏洞数据库(NVD)独立评分的重大安全漏洞。我们的基线网络模型展示了一个攻击者使用无声语音命令来未经授权地访问安全笔记本中的机密信息的情景。我们 - 车载元宇宙语义通信的对抗攻击和防御
本文介绍了一种分层的基于 SemCom 的车联网元宇宙框架,分析了安全漏洞,并提供了防御解决方案,同时指出 SemCom 在车联网元宇宙中的未来研究方向。
- BertRLFuzzer:基于 BERT 和强化学习的模糊测试工具
本研究提出了一种基于 BERT 和强化学习 (Reinforcement Learning) 的 fuzzer 工具 'BertRLFuzzer',旨在查找安全漏洞。BertRLFuzzer 通过使用半监督学习和强化学习两个机器学习概念,可 - 基于 CNN 的物联网设备识别
本研究使用卷积神经网络识别 Aalto 数据集中的设备,为预防安全漏洞提供了重要的因素。
- 基于 LSTM 的物联网设备识别
本研究提出了一种利用长短期记忆(LSTM)来识别 Aalto 数据集中的设备的方法,该方法为预防性安全措施提供了一种重要手段以识别这些设备并检测它们遭受的漏洞。
- 智能电网安全博弈论综述
本论文研究了基于博弈论的方法来分析智能电网的安全威胁,介绍了不同领域的威胁模型和解决方法,以保证能源管理的顺畅运行。
- 针对物理人脸识别的有效对抗性纹理三维网格
本文旨在开发一种更可靠的技术,能够对商业系统进行端到端的对抗性鲁棒性评估,其中采用拟人面部上的精细拓扑的对抗性纹理 3D 网格可欺骗黑盒识别模型并回避防御机制,详尽的数码和物理实验证明了该方法的有效性,包括三种识别 API、四种反欺诈 AP - 针对黑盒代码生成模型的安全漏洞自动发现方法
本文提出了第一种自动发现黑盒生成模型中安全漏洞的方法,并基于少量提示提出了新颖的黑盒逆转方法。通过对高风险安全弱点的代码生成模型进行研究,我们展示了我们的方法可以自动系统地发现各种代码生成模型中的上千个安全漏洞,包括商业黑盒模型 GitHu - 通过手工制作的对抗性例子评估预训练语言模型的容易受攻击性
本文探讨了最新的预训练语言模型(PLMs),包括 GPT-3 和 BERT,存在安全漏洞,使其容易受到对抗性攻击的影响,并提出了一种有效的对抗方法来测试模型的语义相似性并减少其分类质量。
- VulBERTa:面向漏洞检测的简化源代码预训练
本文提出 VulBERTa,一个基于深度学习的方法,用于检测源代码中的安全漏洞。该方法使用真实的开源 C / C ++ 项目进行预训练,可以学习代码语法和语义的深层知识表示,并通过该表示来训练漏洞检测分类器。实验表明 VulBERTa 在多 - 人工智能中的毒化攻击与防御:一项调研
本文综述了机器学习分类器训练中的数据污染攻击的安全漏洞,并介绍了几种可行的检测和缓解机制,比较了不同方法的性能以及固有属性,如可靠性、隐私和可解释性。同时,提供了未来研究方向的参考。
- AAAI图神经网络中的任务和模型无关的对抗攻击
本文研究了对图神经网络(GNN)进行对抗攻击(Adversarial attacks)的问题,并提出了一种名为 TANDIS(Targeted Attack via Neighborhood DIStortion)的算法,它通过扭曲节点邻域 - 利用源代码的分布式表示进行 C 安全漏洞检测
本文评估了代码表示模型 Code2vec 在 C 源代码中检测安全漏洞任务上的表现,结果表明 Code2vec 在此任务上的表现与预训练 RoBERTa 等简单的基于 Transformer 的方法相比具有可比性,并且优于更为简单的基于 N - WWW使用并行数据投毒的有针对性黑盒神经机器翻译攻击
本文介绍针对黑盒神经机器翻译系统的有针对性攻击方法,通过污染少量的平行训练数据来实现攻击,对包括大规模众包数据在内的最新系统的攻击成功率均超过 50%,并提出了针对此类攻击进行防御的可能性。
- 以太坊系统安全概述:漏洞、攻击和防御
介绍了以太坊的新一代区块链技术及其去中心化应用(DApps)的概念,分析了 DApps 系统中存在的安全漏洞、攻击和防御的能力,提出了未来的研究方向。
- 车联网及其接入技术安全漏洞及对策综述
本文从三个方面研究了连接和自主驾驶汽车的安全,包括安全攻击和对策,不同 VANETs 访问技术的安全性挑战与防范对策以及不同访问技术的性能、安全挑战和异构技术的比较。研究结果表明,VANETs 实体失控将损害道路用户的安全、隐私和安全并可能