text perturbations | BriefGPT

关键词text perturbations

搜索结果 - 4

评估耐久性：多模式数字水印的基准洞察
水印技术的鲁棒性在实际应用中的重要性和可靠性，并通过评估图片和文本生成模型生成的带水印内容在常见的实际场景下的鲁棒性验证了这一点。
PDFa month ago
变压器中的注意力 - 相似度关系
我们分析了大型语言模型（LLMs）如何表示上下文之外的单词，研究它们依赖所给上下文来捕捉其语义的情况。我们的文本扰动指导了似然性，揭示了变形器模型中令牌似然性和注意力值之间的相关性。广泛的实验表明，意外的令牌会导致模型不太关注来自自身的信息
PDFa year ago
ACL利用自然语言扰动进行逼真的对抗攻击和防御
本文提出了新算法 ANTHRO，利用文本扰动实现对一个基于 BERT 的分类器进行对抗性攻击，并达到了攻击成功率高，语义保留性好，难以察觉等目标效果，可用于对抗训练。
PDF2 years ago
EMNLP在芝麻街上摇动句法树：使用可控扰动进行多语言探索
探究了文本扰动对 Transformer-based 语言模型的影响，发现换序对模型下游任务性能影响不大，且证实模型对位置编码的使用。研究使用三种印欧语言建立九个 probing 数据集，发现句法敏感度取决于语言和预训练目标，在层数和扰动粒
PDF3 years ago