ACLMay, 2017

跨语言抄袭检测方法的深度研究

TL;DR本文对跨语言抄袭检测方法进行了深入研究,使用一种新的开放数据集,包含多个特征的平行和可比较的文集,我们针对 6 种语言对 2 种文本单元进行研究,以便在深入分析文档风格和语言之间的相关性的同时,得出最佳方法的稳健结论。