关键词neural natural language processing
搜索结果 - 5
- 利用反事实生成减轻文本毒性
通过使用反事实生成方法以及可解释性人工智能(XAI)领域的方法来目标化和缓解文本毒性,我们提出了一种文本解毒方法,该方法能够在去除有害含义的同时保留初始非毒性含义,并且对三个数据集进行比较实证研究和评估结果表明,最近发展的 NLP 反事实生 - EMNLP利用解释方法增强模型
在神经自然语言处理时代,有很多作品试图得出神经模型的解释。本文提出了一种利用解释方法和黄金理论来增强模型的框架,该框架通用性强,可以融合多种解释方法,并且在低资源环境中特别有效。
- 自然语言处理中的模型解释研究综述
本综述通过对忠实度的镜头,回顾了超过 110 种自然语言处理中的模型解释方法。我们考虑了忠实度的定义和评估,以及它对可解释性的重要性,并将现有方法分为五类。最后,我们总结了它们的共同优点和未解决的挑战,并反思了未来的研究方向。
- ACL可学习的文本后门攻击:基于词替换的组合锁攻击
本文研究表明神经自然语言处理模型容易受到后门攻击的威胁,而现有文本后门攻击方法容易被检测和阻拦,因此我们提出一种使用可学习的词汇替换的不可见后门攻击方法,结果表明该方法在攻击成功率接近 100% 的情况下高度隐蔽,对于 NLP 模型的安全构 - 神经自然语言处理中的性别偏见
本文研究了神经自然语言处理系统是否反映了训练数据中的历史偏见。通过定义量化神经自然语言处理任务中的性别偏见的基准测试,实证研究发现目前最先进的神经语言模型和基于基准数据集的循环神经网络在职业看待上存在显著的性别偏见。作者提出了一种基于因果干