- PlagBench: 大型语言模型在抄袭生成和检测中的二元性探索
最近的文献强调了大型语言模型(LLMs)与学术诚信相关的潜在风险,它们可以记忆部分训练实例并在生成的文本中无妥善归属地复制。此外,鉴于它们在生成高质量文本方面的能力,剽窃者可以利用 LLMs 生成与原作无法区分的逼真释义或摘要。为了应对 L - GPT 应用初探:概况与脆弱性
该研究论文探索了 GPT 商店的漏洞和抄袭问题,发现了大规模监控和分析商店以及提取 GPT 内部的有效工具,并揭示了 GPT 内部保护失效导致的广泛抄袭问题。
- 网络编程中的抄袭和 AI 辅助滥用:不公平的好处和特点
编程教育中的抄袭和滥用人工智能助手是当前的问题,该研究基于 web 编程的语境开发了自动化工具,通过比较学生独立完成、抄袭和 AI 助手(ChatGPT)的表现,观察了学生在这些行为下的考试成绩和完成时间,结果显示参与此类行为的学生在考试中 - 生成人工智能的方法:社会公正视角
2023-2024 学年,ChatGPT 的广泛普及将对学术诚信产生影响,高中学生中 77% 报告过使用人工智能驱动的写作辅助工具从事不诚实行为,这种被 Chan(arXiv:2306.03358v2)称为 'AI-giarism' 的 A - 编程测试中不当福利和 ChatGPT 滥用的识别:一项受控实验
ChatGPT 的使用会加速编程测试的完成速度,为学生提供参考代码,但存在学术诚信问题和可能的抄袭风险。
- AI 生成之抄袭侦测:从句子到文件级别
使用自然语言处理技术的对比学习方法,通过多重语义解读对大型语言模型的生成文本进行分析,达到了 94% 的准确率,在学术界检测人工智能生成的文本的抄袭和欺诈具有强大的适应性和可靠性。
- 32 个大学课程中对话式人工智能的感知、表现和可检测性
该研究比较了 ChatGPT 和 32 门大学课程学生的表现,发现 ChatGPT 在许多课程中的表现相当,甚至优于许多学生。此外,其使用也难以被 AI 文本分类器可靠地检测出来,并且出现了学生使用该工具和教育者将其视为抄袭的共识,这些发现 - 混合倡议人工科学文本检测的理解和解释
通过定量实验,我们确定了人工和机器生成科学文本之间的关键区别,并提出了一种混合倡议工作流程,用于高效、可靠地检测科学文本,结合了人类专家的先前知识与机器智能,以及可视化分析原型。我们通过两个案例研究和与熟练研究人员的控制用户研究证明了我们的 - AI 生成文本能否被可靠地检测出来?
本篇研究展示了当前语言模型(LLMs)产生的文本检测器的可靠性不足,并提出了模仿攻击和伪造攻击等问题,强调了在使用 AI 生成文本时的伦理和可靠性问题。
- 深度学习下的释义识别:数据集和方法综述
本文回顾传统和现有的改进的改写识别方法,提出了改写的一种新分类体系。探究了这种类型在流行的数据集中的表现形式以及一些类型改写的不充分表示如何影响改写识别能力,最后提出了更有效地使用 AI 进行改写检测的未来研究方向和数据集。
- 没有艺术家还能有艺术吗?
本文探讨生成式 AI 模型对艺术创作的影响,重点关注了不正当使用艺术家作品的问题以及市场利益转移,同时指出若应用得当,AI 生成模型有潜力成为艺术的一种积极的新方式,不会取代或损害现有的艺术家。
- 多重抄袭的综述:一项性能比较研究
本文是关于抄袭检测在自然语言处理中的研究论文,旨在综合评估不同类型抄袭检测算法的准确性和各自优缺点。通过实验发现,基于句子分离、词语分离和同义词的句子对比方法可以提高抄袭检测的准确率。
- 测量入门编程课程作业中的抄袭率
本文讨论了在 C++ 编写的初级编程课程作业中检测抄袭的方法,提出了一种利用三种基于标记的相似度方法预测是否存在抄袭的计算相似度框架,还测量了每个特征的重要性,并使用人工生成的数据集的结果与原始数据进行了比较。在原始和合成数据集上,我们实现 - 基于文本相似度的孟加拉语抄袭检测
通过 OCR 技术和 Levenshtein Distance 算法,我们构建了一个能够成功检测孟加拉文文本抄袭的网络应用,并利用国家数字图书馆的文献构建了一个文本语料库以提高准确性。
- WWW语言模型是否存在抄袭问题?
本文研究了语言模型中三种类型的抄袭行为(即逐字,改写和思想),分析了细调语言模型的抄袭模式。结果显示,语言模型存在广泛的抄袭,其大小和解码方法与抄袭程度密切相关,抄袭模式的变化取决于其语料库的相似性和同质性。这些发现提出了关于当前语言模型实 - 抄袭检测系统综述:以英语、法语和阿拉伯语语言为例
本文综合比较了使用于阿拉伯语、法语和英语学术和教育场景中的八种抄袭检测系统,评估这些系统对原词抄袭、改写抄袭和跨语言抄袭等三个层次的检测效果及其特点、可用性、技术方面的表现并深入研究了技术类抄袭的形式,同时提供了不同作者提出的抄袭类型和分类 - 基于向量空间模型的电子文本抄袭检测(ICIAfS14)
本文介绍了一种对比向量空间模型中的单个字、双个字、三个字的余弦相似度测量,用于适当的抄袭检测,其增加了对数据集中不经常存在的术语的权重,使用三字技术的余弦相似度测量比其他方法更可取。这种新工具可以用作评估文本类电子作业和减少学生抄袭的有效工