多重抄袭的综述:一项性能比较研究
本文综合比较了使用于阿拉伯语、法语和英语学术和教育场景中的八种抄袭检测系统,评估这些系统对原词抄袭、改写抄袭和跨语言抄袭等三个层次的检测效果及其特点、可用性、技术方面的表现并深入研究了技术类抄袭的形式,同时提供了不同作者提出的抄袭类型和分类的调研。
Jan, 2022
本文对跨语言抄袭检测方法进行了深入研究,使用一种新的开放数据集,包含多个特征的平行和可比较的文集,我们针对 6 种语言对 2 种文本单元进行研究,以便在深入分析文档风格和语言之间的相关性的同时,得出最佳方法的稳健结论。
May, 2017
通过 OCR 技术和 Levenshtein Distance 算法,我们构建了一个能够成功检测孟加拉文文本抄袭的网络应用,并利用国家数字图书馆的文献构建了一个文本语料库以提高准确性。
Mar, 2022
本文讨论了在 C++ 编写的初级编程课程作业中检测抄袭的方法,提出了一种利用三种基于标记的相似度方法预测是否存在抄袭的计算相似度框架,还测量了每个特征的重要性,并使用人工生成的数据集的结果与原始数据进行了比较。在原始和合成数据集上,我们实现了 0.955 和 0.971 的 F1 分数。
Apr, 2022
本文实现了一个系统,用于检测图像内容(如图表、图形、表格等)的剽窃情况。除了统计算法(如 Jaccard 和 Cosine),引入语义算法(如 LSA、BERT、WordNet)在检测高效准确的剽窃方面表现优秀。
Aug, 2023
本文介绍了一种对比向量空间模型中的单个字、双个字、三个字的余弦相似度测量,用于适当的抄袭检测,其增加了对数据集中不经常存在的术语的权重,使用三字技术的余弦相似度测量比其他方法更可取。这种新工具可以用作评估文本类电子作业和减少学生抄袭的有效工具。
Dec, 2014
使用自然语言处理技术的对比学习方法,通过多重语义解读对大型语言模型的生成文本进行分析,达到了 94% 的准确率,在学术界检测人工智能生成的文本的抄袭和欺诈具有强大的适应性和可靠性。
Jun, 2023
本研究提出了一种简单的跨语言抄袭检测方法,不依赖于机器翻译和词义消歧,适用于许多语言,包括资源匮乏的语言,其有效性已证明在几个现有和新的基准中达到了最先进的成果,特别是对于法语、俄语和亚美尼亚语,其依赖于开放式多语言词库和预先训练好的多语言 BERT 语言模型。
Apr, 2023
基于 GPT-3.5 的抄袭文本数据生成方法和基于 Faiss with BERT 的抄袭识别方法在文本抄袭检测任务中表现优异,并提供用户友好的演示平台。
Apr, 2024