Our work focuses on the challenge of detecting outputs generated by Large
Language Models (LLMs) from those generated by humans. The ability to
distinguish between the two is of utmost importance in numerous applications.
However, the possibility and impossibility of such discernment have been
subjects of debate within the community. Therefore, a central que
大型语言模型(LLMs)在自然语言生成(NLG)领域引发了一场革命,展示出生成类似人类文本的惊人能力。然而,它们的广泛使用引入了挑战,必须经过深入研究、伦理审查和负责任的实践来加以解决。本研究深入探讨了这些挑战,探索了现有的缓解策略,尤其强调将 AI 生成的文本作为最终解决方案。此外,我们从理论角度评估了检测的可行性,并提出了解决当前领域限制的新的研究方向。
本文提出了一种新颖的混合方法,将传统的 TF-IDF 技术与先进的机器学习模型相结合,包括贝叶斯分类器、随机梯度下降(SGD)、分类梯度提升(CatBoost)和 12 个 Deberta-v3-large 模型的实例。通过在全面的数据集上进行广泛的实验,我们证明了我们提出的方法在准确区分人工生成和 AI 生成文本方面的有效性。与现有方法相比,我们的方法取得了更好的性能。这项研究为 AI 生成文本检测技术的进展做出了贡献,并为应对 AI 生成内容带来的挑战开发出稳健的解决方案奠定了基础。