ALMs：作者语言模型用于作者归属

Jan, 2024

ALMs: Authorial Language Models for Authorship Attribution

Weihang Huang, Akira Murakami, Jack Grieve

TL;DR本文介绍了一种作者归属方法，即作者语言模型 (ALMs)，它通过对一组候选作者的文本进行经验修正得到的调整语言模型的困惑度，从而识别问询文档的最有可能的作者。我们使用 CCAT50 数据集和 Blogs50 数据集对 ALMs 进行了基准测试，并发现 ALMs 在 Blogs50 上达到 83.6% 的宏平均准确率，超过所有其他方法，在 CCAT50 上达到 74.9% 的宏平均准确率，与最好方法的性能相当。此外，我们还进行了关于短文本的删除测试，结果发现为了达到 70% 的宏平均准确率，ALMs 需要在 Blogs50 上有 40 个词元，在 CCAT50 上有 400 个词元，而为了达到 60% 的宏平均准确率，ALMs 需要在 Blogs50 上有 20 个词元，在 CCAT50 上有 70 个词元。

Abstract

In this paper, we introduce an authorship attribution method called Authorial Language Models (ALMs) that involves identifying the most likely author of a questioned document based on the perplexity of the questi

authorship attribution authorial language models perplexity fine-tuning text ablation testing

发现论文，激发创造

使用神经网络语言模型进行作者归属判定

研究了神经网络语言模型在作者归属问题上的性能，发现与传统非参数化模型相比，其性能更优越。

Feb, 2016

大型语言模型能否识别作者？

使用大型语言模型进行作者身份验证和归属度分析的研究，以及通过详细分析语言特征为决策提供解释，为未来基于大型语言模型的作者身份分析研究建立了新的基准。

Mar, 2024

通过迁移学习使用 ULMFiT 对孟加拉文学进行作者归属

提出了一种使用 AWD-LSTM 架构和有效的迁移学习方法来解决孟加拉文学领域的作者归属问题，通过分析不同的标记化方法，并介绍了一个包含 16966 份样本文本和 13.4 + 百万词汇的公开孟加拉作者归属数据集（BAAD16），此外还释放了六个预训练语言模型的变体。通过对 BAAD16 数据集及其他公开数据集的评估，实验证明所提出的模型优于目前的最先进模型，在 BAAD16 数据集上达到 99.8% 的准确率，而且在作者数量增加时，系统的可伸缩性表现更好，性能依然稳定。

Mar, 2024

大型语言模型上的神经作者归属性：风格分析

通过实证分析大型语言模型（LLMs）的写作特征、对比专有和开源模型的异同、并探索通过语言的词汇、句法和结构方面的风格特征整合实现对 AI 生成文本的追溯，为神经网络作者归属提供经验性洞见，为应对 AI 生成的错误信息的威胁铺平道路。

Aug, 2023

让大型语言模型能够生成带有引文的文本

这项研究介绍了 ALCE，一个自动化 LLMs 引用评估的评测基准，通过自动度量三个维度 - 流畅度、正确性和引用质量，强调了更好的检索器、长文本 LLMs 等方向的改善空间。

May, 2023

增强语言模型：一项综述调查

该论文回顾了一些带有推理技能和使用工具能力的语言模型增强技术，并将其称为增强语言模型 (ALMs)，该模型在缺失令牌预测的目标下，能够学习推理、使用工具，甚至执行任务，具有普通语言模型所没有的上下文处理能力，且在多个基准测试中优于普通语言模型，该技术有望解决传统语言模型的局限性，如可解释性、一致性和可扩展性问题。

Feb, 2023

属性问答：针对属性化大语言模型的评估和建模

本文研究基于属性的 LLM 发展，在开发 Attributed LLMs 的第一步骤中提出可重复的 Attributed QA 评估框架并评估多种结构。实验结果探讨了如何度量归属（attribution）以及现有方法在归属方面的表现如何，并提出了建立带归属特性的 LLMs 的可能方向。

Dec, 2022

朝可验证的生成方式迈进：知识感知语言模型归因的基准

大型语言模型（LLMs）在可靠性方面通常存在不可靠的幻觉。在本文中，我们定义了一项名为知识感知语言模型归因（KaLMA）的新任务，它改进了传统归因语言模型的三个核心问题。

Oct, 2023

基于语法模型的作者验证的似然率

提出了一种基于计算被称为 LambdaG 的概率比值的方法，并通过 12 个数据集的实证评估，证明了 LambdaG 在准确性和 AUC 方面的优势，以及其与语言处理的认知语言学理论的兼容性。

Mar, 2024

关于大型语言模型（LLMs）的局限性：虚假归因

对大型语言模型的一项重要限制 - 错误归因进行了研究，提出了一种新的幻觉度量指标 - 简单幻觉指数（SHI）。通过评估三个开放领先模型在零样本设置下的能力，特别是对较小文本块的自动作者归属任务，为验证其他模型提供了数据和代码。

Apr, 2024