Apr, 2024

PetKaz 参与 SemEval-2024 任务 8:语言学能够捕捉 LLM 生成文本的细节吗?

TL;DR本文针对 SemEval-2024 任务 8“多生成器、多领域和多语种黑盒机器生成文本检测”,以英文机器生成文本(MGTs)的检测为重点,结合 RoBERTa-base 嵌入和多样性特征,利用重新采样的训练集,取得了第 124 名中的第 12 名,结果表明我们的方法在未见模型和领域上具有普适性,准确率达到 0.91。