Jan, 2024

LLM 作为共同作者的挑战:检测 LLM 与人类混合大小写

TL;DR大语言模型与机器生成文本(MGT)在新闻和教育等领域的广泛应用中出现了潜在的质量和信息完整性问题。本研究提出了混合文本形式 ——mixcase,并构建了 MixSet 数据集,旨在专门研究这些混合修改场景,并通过实验证明现有的 MGT 检测器在识别 mixcase 时存在困难,尤其是在处理微妙的修改和样式适应性方面。研究结果强调了为 mixcase 定制更细粒度的检测器的紧迫性,并为未来研究提供了有价值的见解。