Sep, 2023

AuTexTification 在 IberLEF 2023 上的概述:多领域机器生成文本的检测和归因

TL;DR本文介绍了 IberLEF 2023 研讨会中 AuTexTification 共享任务的概述,其中包括两个子任务:子任务 1 要确定文本是人工撰写还是由大型语言模型生成,子任务 2 要将机器生成的文本归属于六个不同的文本生成模型之一。我们的 AuTexTification 2023 数据集包含两种语言(英语和西班牙语)和五个领域(推文、评论、新闻、法律和操作指南)的超过 160,000 个文本。总共有 114 个团队报名参加,其中 36 个团队发送了 175 个运行结果,并有 20 个团队发送了他们的工作笔记。在本概述中,我们介绍了 AuTexTification 数据集和任务,参赛系统以及结果。