BriefGPT.xyz
Ask
alpha
关键词
adversarial language examples
搜索结果 - 1
ICLR
测试时间调整强化语言模型
大规模语言模型在很多语言任务上取得了最先进的性能。然而,它们在针对对抗性语言示例时失败了,这些句子被精心优化以欺骗语言模型,但对人类来说具有类似的语义意义。我们的方法可以动态地适应输入句子并使用屏蔽词的预测结果,从而修复许多语言对抗攻击,而
→
PDF
8 months ago
Prev
Next