Nov, 2023
分辨人工撰写和机器生成的文本:利用聚类和信息论技术
Spot the Bot: Distinguishing Human-Written and Bot-Generated Texts Using Clustering and Information Theory Techniques
Vasilii Gromov, Quynh Nhu Dang
TL;DR使用无监督学习技术,通过聚类(精确和模糊)和信息技术相结合,构建了一个强大的模型,可以检测不同类型的生成文本,发现生成的文本更加混乱,而文学作品更加复杂,在人类文本的聚类结果中,模糊聚类更多,而生成的文本聚类更加紧凑和明确。