Jan, 2024

多作者文档的文体分析和作者风格变化检测

TL;DR本文研究了基于文体分析技术的三项主要任务:单作者和多作者文档的分类、单一变换检测以及多作者文档中的作者变换检测。通过整合多种自然语言处理算法和权重优化技术的基于优势的融合框架,本文提出了一种解决方案,并通过对清洗和原始数据集的大量实验探索了特殊字符在这些任务的性能上的潜力。实验结果表明,在基准数据集上,对于所有三个任务,本文的解决方案相比现有解决方案取得了显著的改进。