- Gram2Vec:一种可解释的文档向量化方法
介绍了 Gram2Vec,一种将文档嵌入到高维空间的语法风格嵌入算法。通过提取文本中存在的语法特征的标准化相对频率,Gram2Vec 提供了固有的可解释性。使用 Gram2Vec 向量的作者到文档的映射可视化,并演示了添加或删除特征以查看哪 - 比喻的说法:通过多任务比喻语言建模进行作者归属
基于多任务比喻语言模型的研究在文本中检测多种比喻语言特征,并且集成到作者归属任务中以提高性能。
- 减轻举报人重新识别风险的半自动化文本清理工具
我们提出并评估了一种用于重写文本的分类和缓解策略,该策略涉及向揭发者征求风险和实用性评估,并使用微调的 LLM 进行复述,能够显著降低作者归属攻击的准确性,同时保留原始内容语义的多达 73.1%。
- 通过迁移学习使用 ULMFiT 对孟加拉文学进行作者归属
提出了一种使用 AWD-LSTM 架构和有效的迁移学习方法来解决孟加拉文学领域的作者归属问题,通过分析不同的标记化方法,并介绍了一个包含 16966 份样本文本和 13.4 + 百万词汇的公开孟加拉作者归属数据集(BAAD16),此外还释放 - AAAIALISON: 高效快速的文体风格特征作者混淆
现代作者指定(AA)和作者混淆(AO)是隐私研究中两个重要且竞争性的任务,为了解决现有 AA 方法引发的隐私问题,本研究提出了一个实用的 AO 方法 ALISON,通过攻击三种基于 Transformer 的 AA 方法在两个基准数据集上表 - ALMs:作者语言模型用于作者归属
本文介绍了一种作者归属方法,即作者语言模型 (ALMs),它通过对一组候选作者的文本进行经验修正得到的调整语言模型的困惑度,从而识别问询文档的最有可能的作者。我们使用 CCAT50 数据集和 Blogs50 数据集对 ALMs 进行了基准测 - 基于 Transformer 的大型语言模型的 AI 内容自检测
本文介绍了直接来源检测的概念,并评估了生成型 AI 系统是否能够识别其输出并将其与人工编写的文本加以区分。结果表明,Google 的 Bard 模型表现出最大的自检测能力,准确率达到 94%,其次是 OpenAI 的 ChatGPT,准确率 - 文化遗产应用中可解释的作者识别:一种新的观察分析
本研究探索现有的通用可解释人工智能技术在计算作者识别中的适用性,尤其关注提供给文化遗产领域学者的解释。通过在真实的作者识别数据上进行实验,我们评估了三种不同类型的可解释人工智能技术在三个不同的作者识别任务上的相对优势,并指出虽然这些技术对于 - EMNLPHANSEN:人工智能和人类口语文本的作者分析基准
通过引入人类和人工智能口语文本基准数据集 HANSEN,我们进行了笔者归属和作者验证的评估,并使用最先进的模型进行人类与人工智能口语文本检测。
- 通过双向 LSTM 模型进行作者归属的 ChatGPT 新闻检测
该研究使用 ChatGPT 的人工智能模型,通过自然语言处理技术建立了一个能够识别 ChatGPT 所写的新闻文章的作者鉴定模型,其中 LSTM 神经网络模型表现最佳,对测试集数据达到 91.57%的准确率。
- GPT-who: 一种基于信息密度的机器生成文本检测器
通过 UID 原则构建了 GPT-who 检测器,它利用 UID 特征对每个大型语言模型和人类作者的统计签名进行建模,以实现准确的作者归属。GPT-who 在四个大规模基准数据集上表现优于现有的检测器,并能够区分由非常复杂的大型语言模型生成 - 杜撰的众声:重访鲁迅和周作人之间的争议论文
鲁迅和周作人是中国现代文学中最有影响力的作家之一,本研究使用定量方法重新审视 1912 年由兄弟二人化名发表的三篇争议性论文,通过一个可解释的作者归属模型进行文体学分析,以调查这些文章的作者,研究兄弟二人的写作风格。我们的发现表明,《看中国 - TopRoBERTa:深伪造文本的拓扑感知作者归属
我们提出了 TopRoBERTa 方法,通过在 RoBERTa 模型中加入拓扑数据分析(TDA)层,捕捉深度伪造文本中的更多语言模式。通过从 RoBERTa 的重塑池输出中提取 TDA 特征作为输入,我们展示了具有 TDA 层时处理嘈杂、不 - 将双向长短期记忆网络与子单词嵌入结合,用于作者归属度量
本文提出了一种基于双向长短期记忆 (BLSTM) 和二维卷积神经网络 (CNN) 的方法来进行文本作者识别,通过使用子词信息获得特征之间的顺序关系以及了解风格的局部语法位置,实验证明该方法相比其他最新方法在 CCAT50 和 Twitter - KUCST 参加 CheckThat 2023: 使用通用模型的高水平表现
本文介绍了我们在 CheckThat2023 共享任务的任务 2 和任务 3A 中的方法。我们利用了一种通用方法,训练了许多机器学习模型,结果表明 Gradient Boosting 在两个任务中表现最佳,但整体表现与其他团队相当。
- 通过提示 LLMs 学习可解释的风格嵌入
本研究使用提示技术,对大量文本进行文体分析,得到了一组可解释的文体表示方法 LISA embeddings,为解决当前使用神经网络进行文体表示学习所面临的可解释性困境提供了新的解决方案。
- ACL面向 NLP 的新颖性检测和适应性评估统一框架及其在作者归属方面的实例化
该论文介绍了 NoveltyTask,通过评估系统在处理 novelties 方面的性能来开始一个系统性的研究,并将其应用于作者归属任务中,使用 Amazon 评论的数据集进行实验和探索基准方法,最终结果表明该任务具有相当低的性能。
- SHIELD: 阻止代码署名归属
本文介绍了 SHIELD,对六种当前最先进的作者归属方法进行攻击后的实验,通过在 Google Code Jam 竞赛中利用 200 个编程者数据集,从非有目标攻击和有目标攻击两个方向对不同的代码归属提取技术进行了实验,发现现有的作者归属方 - 双语俄法作家与非双语法国作家的文学作品差异的作者归属问题
该论文运用作者归属方法回答了关于二十世纪末的双语俄法作家在法语小说写作中是否存在共同的风格特征、是否能将它们与非双语法国作家的文本区分开、以及是否在俄罗斯作家的法语文本中观察到干扰现象等问题。研究采用支持向量机(SVM)、K - 近邻(KN - 基于 BERT 的罗马尼亚语数据集 ROST 的作者归属
使用预训练的语言模型 BERT 来检测罗马尼亚语文本的作者,虽然数据集不平衡,但结果比预期好,有时超过 87%的宏平均精度。