transferable attacks | BriefGPT

关键词transferable attacks

搜索结果 - 5

跨语言转移的困境：通过指令调整在 LLMs 中的后门攻击的跨语言可迁移性
我们的研究重点关注跨语言背门攻击对多语言 LLM 的影响，特别研究在一个或两个语言的指令调整数据中添加恶意行为如何影响未被攻击的语言的输出。我们的实证分析表明，我们的方法在 mT5、BLOOM 和 GPT-3.5-turbo 等模型中非常有
PDF2 months ago
跨界攻击：对 AI 系统可转移攻击的综合调查
综合探索传输攻击的学习方法，着重在网络安全的背景下，通过不同领域的研究，对传输攻击的架构和影响进行分类和评审，并提出了未来的研究方向。
PDF8 months ago
可迁移的语义分割攻击
对语义分割模型进行全面分析，发现传统的对抗攻击方法无法很好地转移到目标模型，因此需要研究适用于语义分割的可传递攻击方法。通过有效的数据增强、平移不变特征以及稳定的优化策略，提出了一种基于集成的语义分割攻击方法，以实现更有效且具有更高可传递性
PDFa year ago
ICML通过图毒化对节点嵌入进行对抗攻击
本研究针对网络表征学习方法中基于随机游走的广泛使用问题，提供了首个对其鲁棒性的对抗性漏洞分析，提出有效的对抗性扰动对网络结构造成了负面影响，并证明本研究提出的攻击是可迁移的。
PDF6 years ago
通过正则化对抗梯度实现神经网络的鲁棒训练
通过限制神经网络的对抗梯度并增加对抗性样本生成的难度，提高了神经网络的鲁棒性，使其能够抵御各种类型的对抗性攻击，特别是迁移攻击。
PDF6 years ago