BriefGPT.xyz
大模型
Ask
alpha
关键词
nlp attacks
搜索结果 - 1
神经网络是否被对抗性对齐?
本篇研究探索大型的自然语言处理模型是否能够抵御用户故意输入的对抗性样本(adversarial examples)的攻击,进一步研究多模型模型在敌对攻击下的表现。结果发现,虽然当前的 NLP 攻击在某种程度上是无效的,但多模型模型很容易受到
→
PDF
a year ago
Prev
Next