关键词dimensionality mismatch
搜索结果 - 2
- 对语言模型激活的敌对攻击的尺度定律
用语言模型的激活进行对抗性攻击的研究表明,操纵模型激活的相对较小的子集可以精确控制大量(最多达到 1000 个)随后的标记预测,并发现对输入空间的控制与对输出空间的控制存在一致性,并且攻击模型的激活比攻击标记要强得多,这为对多模式和选定检索 - 去噪深层生成模型
本文提出使用高斯噪声来解决高维密度函数模拟低维结构数据时的维度不匹配问题,并基于 Tweedie's 公式和噪声方差为条件的模型提出了两种方法。研究结果表明,虽然这些方法在理论上有合理性,但在实践中表现不一,并不是解决维度不匹配问题的最佳方