AuTexTification 在 IberLEF 2023 上的概述：多领域机器生成文本的检测和归因

Sep, 2023

AuTexTification 在 IberLEF 2023 上的概述：多领域机器生成文本的检测和归因

Overview of AuTexTification at IberLEF 2023: Detection and Attribution of Machine-Generated Text in Multiple Domains

Areg Mikael Sarvazyan, José Ángel González, Marc Franco-Salvador, Francisco Rangel, Berta Chulvi...

TL;DR本文介绍了 IberLEF 2023 研讨会中 AuTexTification 共享任务的概述，其中包括两个子任务：子任务 1 要确定文本是人工撰写还是由大型语言模型生成，子任务 2 要将机器生成的文本归属于六个不同的文本生成模型之一。我们的 AuTexTification 2023 数据集包含两种语言（英语和西班牙语）和五个领域（推文、评论、新闻、法律和操作指南）的超过 160,000 个文本。总共有 114 个团队报名参加，其中 36 个团队发送了 175 个运行结果，并有 20 个团队发送了他们的工作笔记。在本概述中，我们介绍了 AuTexTification 数据集和任务，参赛系统以及结果。

Abstract

This paper presents the overview of the autextification shared task as part of the iberlef 2023 workshop in Iberian Languages Evaluation Forum, within the framework of the SEPLN 2023 conference. →

autextification iberlef 2023 workshop text classification text generation models dataset

发现论文，激发创造

UPB 在 IberLEF-2023 AuTexTification 中的使用：使用 Transformer 集成检测机器生成的文本

该研究论文描述了 UPB 团队在 IberLEF-2023 的 AuTexTification 共享任务中提交的解决方案，主要使用基于 Transformer 的深度学习模型以及多任务学习等训练技术，最佳模型在英语和西班牙语数据集上分别达到了 66.63% 和 67.10% 的宏 F1 分数。

Aug, 2023

SemEval-2024 任务 8：多领域、多模型和多语种机器生成文本检测

SemEval-2024 Task 8 的主要发现是多生成器、多领域和多语言的机器生成文本检测。

Apr, 2024

俄语人工文本检测 RuATD 共享任务 2022 的发现

本研究是 2022 年 Dialogue Evaluation 活动中的人工文本检测任务的一部分，利用 14 个文本生成器包括一个人类写手和 13 个针对机器翻译、改写、文本摘要、文本简化等自然语言生成任务进行了微调的模型，通过二元分类和多类分类确定文本是否为自动生成以及找到其作者，得出的结果对现有基线方法进行了优化。

Jun, 2022

SemEval-2024 任务 8：多领域机器生成文本检测技术的综合分析

本论文介绍了我们在 SemEval2024 Task8 中用于检测跨各个领域的机器生成文本的方法，包括统计、神经网络和预训练模型方法，并通过深入的错误分析评估了这些方法的有效性。在单语和多语境下，我们的方法在子任务 A 单语上获得 86.9％的准确率，在子任务 B 上获得 83.7％的准确率。此外，我们还强调了未来研究中的挑战和重要因素。

Mar, 2024

基于集成 LLM 方法的生成式人工智能文本分类

本文提出了一种集成神经模型以检测大型语言模型生成的语言，并对模型进行归因的方法。

Sep, 2023

英法德西语人工智能与人类生成文本分类

本文分析了用于英语、法语、德语和西班牙语识别人工智能生成文本和人类生成文本的特征，并对不同语言进行了比较。研究了两种情况：(1) 检测由人工智能生成的原创文本，和 (2) 检测由人工智能重新表述的文本。通过建立包含每种语言 10 个主题的新文本语料库来训练和测试这个多语言环境中的分类器。特征的组合在检测人工智能生成的文本时表现最好，说明这些特征可以应用于其他相关语言：西班牙语的 F1 得分接近 99%，英语为 98%，德语为 97%，法语为 95%。在检测人工智能重新表述的文本时，大多数情况下使用所有特征的系统效果最好，但对于德语（72%）和西班牙语（86%），仅使用文档特征最好，而对英语则仅使用文本向量特征可获得最佳结果（78%）。

Dec, 2023

用于多生成器、多领域和多语言机器生成文本检测的细调大型语言模型

SemEval-2024 Task 8 引入了识别多语言和领域中大型语言模型（LLMs）生成的机器文本的挑战。本文关注于二元分类和多类分类的子任务，并通过传统机器学习和自然语言处理进行特征提取以及基于 LLMs 进行文本分类的两种方法进行解决，结果显示变压器模型，尤其是 LoRA-RoBERTa，在多语言环境中使用多数表决方法能够高效地识别机器生成的文本。

Jan, 2024

PetKaz 参与 SemEval-2024 任务 8：语言学能够捕捉 LLM 生成文本的细节吗？

本文针对 SemEval-2024 任务 8“多生成器、多领域和多语种黑盒机器生成文本检测”，以英文机器生成文本（MGTs）的检测为重点，结合 RoBERTa-base 嵌入和多样性特征，利用重新采样的训练集，取得了第 124 名中的第 12 名，结果表明我们的方法在未见模型和领域上具有普适性，准确率达到 0.91。

Apr, 2024

RFBES 在 SemEval-2024 任务 8 中的应用：探索用于区分人工智能生成和人类编写的文本的句法和语义特征

研究表明，利用大型语言模型可以高准确度地区分人工智能生成的文本和人类编写的文本，尤其在语义方面会更加有帮助，而句法方面还有改进的空间。

Feb, 2024

QUST 团队参加 SemEval-2024 任务 8：检测人工智能生成文本的单语和多语方法的综合研究

本文介绍了 QUST 团队参与 SemEval 2024 任务 8 的研究，通过数据增强和清洗来提高模型训练效率和准确性，评估了传统的深度学习方法、多尺度正负未标记框架（MPU）、微调、适配器和集成方法，并选择了在单语任务中准确性最高的模型，在子任务 A 和 B 中进行评估。最终模型构建采用了将微调与 MPU 相结合的堆叠集成方法。我们的系统在多语言设置下的子任务 A 官方测试集中获得第八名（准确性得分第 13 名），我们在此链接发布了系统代码。

Feb, 2024