Apr, 2024

AISPACE 在 SemEval-2024 任务 8 上:用于检测多生成器机器生成文本的类平衡软投票系统

TL;DR本研究针对 SemEval-2024 Task 8 提出了一个系统,主要处理 Subtask B,该系统旨在检测给定的全文是由人类撰写还是由特定的大型语言模型生成,这是一个多类文本分类任务。我们团队 AISPACE 对基于 Transformer 的模型进行了系统的微调研究,包括仅编码器、仅解码器和编码器 - 解码器模型。我们比较了它们在该任务上的性能,并发现仅编码器模型表现出色。我们还应用了加权交叉熵损失函数来解决不同类别样本不平衡的问题。此外,我们采用了多模型集成的软投票策略来提高预测的可靠性。我们的系统在 Subtask B 中排名第一,为这个新挑战设立了最新的基准。