Dec, 2014

基于向量空间模型的电子文本抄袭检测(ICIAfS14)

TL;DR本文介绍了一种对比向量空间模型中的单个字、双个字、三个字的余弦相似度测量,用于适当的抄袭检测,其增加了对数据集中不经常存在的术语的权重,使用三字技术的余弦相似度测量比其他方法更可取。这种新工具可以用作评估文本类电子作业和减少学生抄袭的有效工具。