Mar, 2022

基于文本相似度的孟加拉语抄袭检测

TL;DR通过 OCR 技术和 Levenshtein Distance 算法,我们构建了一个能够成功检测孟加拉文文本抄袭的网络应用,并利用国家数字图书馆的文献构建了一个文本语料库以提高准确性。