Jan, 2024

用于多生成器、多领域和多语言机器生成文本检测的细调大型语言模型

TL;DRSemEval-2024 Task 8 引入了识别多语言和领域中大型语言模型(LLMs)生成的机器文本的挑战。本文关注于二元分类和多类分类的子任务,并通过传统机器学习和自然语言处理进行特征提取以及基于 LLMs 进行文本分类的两种方法进行解决,结果显示变压器模型,尤其是 LoRA-RoBERTa,在多语言环境中使用多数表决方法能够高效地识别机器生成的文本。