- PlagBench: 大型语言模型在抄袭生成和检测中的二元性探索
最近的文献强调了大型语言模型(LLMs)与学术诚信相关的潜在风险,它们可以记忆部分训练实例并在生成的文本中无妥善归属地复制。此外,鉴于它们在生成高质量文本方面的能力,剽窃者可以利用 LLMs 生成与原作无法区分的逼真释义或摘要。为了应对 L - 基于击键动态的抵制学术不诚实行为在 LLM 时代的应用
该研究提出了一种基于击键动态的方法,以区分学术环境中真实和辅助写作,并利用改进的 TypeNet 架构训练检测器。研究结果突显了真实和辅助写作之间击键动态的显著差异,并对提高数字教育平台的可靠性产生影响。
- CollabStory: 多 LLM 协作故事生成与作者分析
LLM 模型间的合作创作及其影响是一个重要的研究方向,本研究生成了 CollabStory 数据集,用于探索单一作者与多作者间合作创作的情景,并提出了解决多 LLM 模型合作创作的基线方法。
- 通过敌对攻击实现抗 LLM 的数学问题生成
在教育领域中,大型语言模型 (LLMs) 的快速发展给当前的剽窃检测工具带来了挑战,本文通过生成拟保持原问题的结构和难度但无法由 LLMs 解决的对抗性示例,来探索确保公平评估的新范式,通过在数学应用问题领域利用抽象语法树生成对抗性实例,改 - 基于 Transformer 的大型语言模型的 AI 内容自检测
本文介绍了直接来源检测的概念,并评估了生成型 AI 系统是否能够识别其输出并将其与人工编写的文本加以区分。结果表明,Google 的 Bard 模型表现出最大的自检测能力,准确率达到 94%,其次是 OpenAI 的 ChatGPT,准确率 - 利用统计和语义分析技术进行图像内容的文本相似度
本文实现了一个系统,用于检测图像内容(如图表、图形、表格等)的剽窃情况。除了统计算法(如 Jaccard 和 Cosine),引入语义算法(如 LSA、BERT、WordNet)在检测高效准确的剽窃方面表现优秀。
- AI 生成之抄袭侦测:从句子到文件级别
使用自然语言处理技术的对比学习方法,通过多重语义解读对大型语言模型的生成文本进行分析,达到了 94% 的准确率,在学术界检测人工智能生成的文本的抄袭和欺诈具有强大的适应性和可靠性。
- 一种将基于 BERT 的词嵌入、基于 Attention 的 LSTMs 和改进的差分进化算法相结合的新型剽窃检测方法
本研究提出了一种基于注意力机制的长短时记忆(LSTM)和双向编码器表示来自变压器(BERT)词嵌入的检测抄袭的新方法,它使用经过优化的差分进化(DE)方法进行预训练和使用聚类基础变异运算符的 DE 算法来引发 BP 过程。证明该方法与传统方 - 跨语言抄袭检测的简单有效方法
本研究提出了一种简单的跨语言抄袭检测方法,不依赖于机器翻译和词义消歧,适用于许多语言,包括资源匮乏的语言,其有效性已证明在几个现有和新的基准中达到了最先进的成果,特别是对于法语、俄语和亚美尼亚语,其依赖于开放式多语言词库和预先训练好的多语言 - 聊天 GPT 是否会让你被捕?重新思考抄袭检测
本研究旨在探究智能 AI 写作机器人 ChatGPT 生成的学术论文内容的原创性,并使用两种常用的抄袭检测工具评估了 ChatGPT 生成的 50 篇论文的独创性。结果表明,ChatGPT 在许多主题上具有高度的原创性,并有潜力生成具有复杂 - 神经语言模型的一致性蒸馏架构
本研究探讨了一种 Knowledge Distillation 的新方法,即从神经网络和词汇知识库中提取语言信息,以提供大规模模型的高效替代方案,并提出了两种基于多个 teacher networks 预测权重的技术以及一种用于词义消歧的方 - 大型语言模型如何改变机器改写抄袭
本文探讨了使用 T5 和 GPT-3 模型在 arXiv、学生论文和 Wikipedia 上生成机器的译文,并评估了六种自动化解决方案和一种商业剽窃检测软件的检测性能。结果表明,GPT-3 生成的译文质量可以与原始文本一样,而且难以区分真假 - 利用预训练语言模型欺骗 MOSS 检测
研究如何使用大型语言模型在绕过常用的 AI 工具和检测软件相似性的情况下,解决初级编程作业,并探讨其伦理和教育意义。
- EMNLP跨文档注意力的多级文本对齐
本文提出了一种新的学习方法,使先前建立的用于表示文档的分层注意编码器具有跨文档关注组件,能够在多个层次上对齐文本,其在引用和抄袭检测方面的应用表现优异。
- 源代码归属作者辨识:一种语言不可知的方法及其在软件工程中的适用性
介绍了一种新的语言无关的源代码作者归属方法,并提出了一种更好地反映软件工程潜在实际应用方面的数据收集方法,指出现有合成数据集在现实数据上的验证精度下降很多,提出了下一步设计和评估作者归属模型的方向。
- 一种轻量级的跨语言语义文本相似度方法
该研究提出了一种基于词向量的跨语义相似度计算方法,只需要一个有限的单词翻译库,能够适用于几乎所有语言对,达到与监督和资源密集型方法相近的表现,在可比较语料库中提取平行句子和跨语言抄袭检测任务中得到与现有模型相当的性能。