CHEAT：用于检测 ChatGPT 写作的大规模数据集

Apr, 2023

CHEAT：用于检测 ChatGPT 写作的大规模数据集

CHEAT: A Large-scale Dataset for Detecting ChatGPT-writtEn AbsTracts

Peipeng Yu, Jiahan Chen, Xuan Feng, Zhihua Xia

TL;DR研究了 ChatGPT 对学术界原创性和严谨性的可能负面影响，并提出了一个大规模数据集以支持检测算法的开发。该数据集包含了 35,304 个合成摘要，同时对现有的文本合成检测算法进行了深入分析，表明 ChatGPT 合成的摘要是可以被检测出来的，但随着人类参与的增加，检测难度会增加。

Abstract

The powerful ability of chatgpt has caused widespread concern in the academic community. Malicious users could synthesize dummy academic content through chatgpt, which is extremely harmful to academic rigor and o

chatgpt academic content detection large-scale dataset synthetic abstracts text synthesis detection algorithms

发现论文，激发创造

ChatGPT，还是不 ChatGPT：这是一个问题！

本研究的主要目的是提供 ChatGPT 检测的最新技术的全面评估，同时我们评估了其他 AI 生成的文本检测工具，以检测 ChatGPT 生成的内容。此外，我们还创建了一个基准数据集用于评估各种技术在检测 ChatGPT 生成内容方面的性能。研究结果表明，现有方法都不能有效地检测 ChatGPT 生成的内容。

Apr, 2023

深入探究 AI 生成摘要的语言特点

ChatGPT 生成语言模型的研究中，自动生成的文本需要自动识别以保持信息的透明度和可信度。本研究中，我们试图检测 ChatGPT 生成的摘要，通过提取文本的语义和词汇特性，并观察到传统机器学习模型能够自信地检测这些摘要。

Dec, 2023

AI 生成文本检测工具的实证研究

本研究旨在创建一个多领域数据集，以测试用于检测高校和其他研究机构使用的人工生成信息的最先进 API 和工具。六种不同的人工智能文本识别系统，包括 “GPTkit”，“GPTZero”，“Originality”，“Sapling”，“Writer” 和 “Zylalab”，准确率介于 55.29% 至 97.0% 之间。尽管所有工具在评估中表现良好，但原创性在各方面表现尤为出色。

Sep, 2023

CheckMe If You Can：利用 CheckGPT 检测 ChatGPT 生成的学术写作

文章提供了 GPABenchmark 数据集，并设计了一种名为 CheckGPT 的 LLM 内容检测器，它可以高精度检测 LLM 生成的学术写作和在不同领域进行迁移学习，并具有可解释性。

Jun, 2023

检测虚假生成的科学摘要

本研究基于 GPT-3 模型自动生成科学论文摘要，通过机器学习模型结合多种文本表示方法来辨别机器生成文本，并分析模型性能及讨论相关研究问题，旨在揭示人工智能生成文本的能力和局限性。

Apr, 2023

ChatGPT 是否正在改变学术写作风格？

通过对从 2018 年 5 月到 2024 年 1 月提交的 100 万篇 arXiv 论文进行统计分析，我们评估了 ChatGPT 在其摘要中的文本密度，通过词频变化的统计分析。我们的模型在真实摘要和 ChatGPT 修改后的摘要（模拟数据）的混合数据上进行校准和验证，经过仔细的噪声分析。我们发现，ChatGPT 对 arXiv 摘要的影响正在增加，特别是在计算机科学领域，ChatGPT 修改的摘要比例估计约为 35%，如果我们以 “修改以下句子” 作为基准。最后，我们分析了 ChatGPT 对学术写作风格渗透的积极和消极方面。

Apr, 2024

检测 ChatGPT 生成文本的波兰比例：ChatGPT 是否涉猎到文本？

通过引入 HPPT 数据集和 “Polish Ratio” 方法，本研究提出了更强健的检测器，可以区分纯 ChatGPT 生成的文本和 ChatGPT 优化的人工写作文本，并且通过量化 ChatGPT 的参与度，提供了更全面的解释性。

Jul, 2023

学术出版物中自动生成文本检测基准语料库

本研究提出两个数据集，一个完全由 GPT-2 模型生成的合成数据集和一个部分用 Arxiv-NLP 模型生成的文本替换数据集，评估数据集的质量，难度以及分类模型的区分能力。

Feb, 2022

利用真实出版文本改进 ChatGPT 生成的伪科学检测：引入一种监督学习网络算法 xFakeBibs

通过使用一种新设计的监督机器学习算法，本研究揭示了如何区分 ChatGPT 生成的出版物和科学家生成的对应物。与 ChatGPT 内容进行比较时，明显看到 ChatGPT 仅贡献了 23％的双字词内容，这比其他 10 个校准折叠中的任何一个都少于 50％。尽管这项工作提出了一种检测 ChatGPT 生成的虚假科学的算法方法，并且准确度很高，但仍然很难检测到所有虚假记录。这项工作确实是朝着对抗虚假科学和错误信息的正确方向迈出的一步。

Aug, 2023

ChatGPT 检测：探究 ChatGPT 生成文本的现状概述

用于区分 ChatGPT 生成文本和人类生成文本的当前方法的综述，包括构建用于检测 ChatGPT 生成文本的不同数据集，采用的各种方法，对人类与 ChatGPT 生成文本特征的定性分析，并最终总结研究结果为一般性见解。

Sep, 2023