论书法
本文介绍了一种基于功能词邻接网络的作者归属度量方法,研究了WAN参数的最优选择和不同作者之间的比较,结果显示相对熵是有效的判别方法,同时,功能词邻接网络与词频方法的组合可以进一步提高归属度量的准确度。
Jun, 2014
利用复杂网络的概念和方法,研究关键词识别、自动提取摘要和作者归属等自然语言处理任务中的模式识别技术,提出了基于功能词重复模式的作者归属任务,运用机器学习方法对其进行验证,结果表明模式能够区分不同作者的写作风格,并推荐将其应用于其他相关的语言任务。
Jul, 2016
这篇论文介绍了一种基于细胞自动机理论的文本网络特征提取方法,着眼于拓扑和动态方面的衡量,表明此方法在作者识别上优于传统的基于拓扑度量的方案,并强调预处理步骤对识别效果的影响。
Oct, 2016
通过深度学习模型,特别是包含字符 n-grams 和句法信息的模型,学习的表示方式有望提高跨领域的表示泛化能力,从而选择适当的文体特征在不同场景下实现更准确的作者识别。
Sep, 2023
利用角色互动图和自然语言处理派生的特征,对当代文学作品进行社会调查和信息检索。从文学作品构建角色互动图,提取相关图特征,并利用这些特征解决各种现实生活问题。实验评估表明,角色互动图在文学作品的特定评估和信息检索方面具有高度有效性。
Oct, 2023
本研究通过开发一套资源集合,包括NLP分析工具、清理和注释小说的数据库以及相关的网页接口,来进行大规模小说分析,描述了注释系统的主要功能及其价值,并展示了从网站中获取的分析结果样本,如人物出现和互动的可视化、类似的书籍、代表性词汇、词类统计和阅读难度指数,同时解释了通过注释格式在大型小说语料库中进行定性和定量分析的应用。
Nov, 2023
本研究解决了跨主题和跨类型的作者归属问题,提出了针对性的训练数据选择方法和创新学习课程,旨在减少模型对主题信息的依赖而增强对风格信息的识别能力。研究结果显示,该方法在平均跨类型作者归属中实现了62.7%的相对提升,并在每种类型中实现了16.6%的提高。
Aug, 2024
本文针对现有作者归属方法无法解释的潜在空间表示问题,提出了一种新颖的解释方法,通过识别潜在空间中的代表性点并利用大型语言模型生成各点写作风格的自然语言描述。研究发现,该方法在预测一致性方面优于其他基线,并且通过人类评估验证了风格描述作为潜在空间解释的有效性,帮助提高作者归属任务的准确率,平均提升约20%。
Sep, 2024