论书法

May, 2017

On the "Calligraphy" of Books

Vanessa Q. Marinho, Henrique F. de Arruda, Thales S. Lima, Luciano F. Costa, Diego R. Amancio

TL;DR本文介绍了一种基于复杂网络的方法来识别文本的作者，通过考虑故事流传来捕捉作者的主导结构。实验证明了该方法在可视化方面有很大潜力并能够揭示作者的个人特征。

Abstract

authorship attribution is a natural language processing task that has been widely studied, often by considering small order statistics. In this paper, we explore a →

发现论文，激发创造

通过功能词邻接网络进行作者归属

本文介绍了一种基于功能词邻接网络的作者归属度量方法，研究了WAN参数的最优选择和不同作者之间的比较，结果显示相对熵是有效的判别方法，同时，功能词邻接网络与词频方法的组合可以进一步提高归属度量的准确度。

Jun, 2014

基于网络模式识别的作者归属

利用复杂网络的概念和方法，研究关键词识别、自动提取摘要和作者归属等自然语言处理任务中的模式识别技术，提出了基于功能词重复模式的作者归属任务，运用机器学习方法对其进行验证，结果表明模式能够区分不同作者的写作风格，并推荐将其应用于其他相关的语言任务。

Jul, 2016

基于类生网络自动机的作者身份鉴别

这篇论文介绍了一种基于细胞自动机理论的文本网络特征提取方法，着眼于拓扑和动态方面的衡量，表明此方法在作者识别上优于传统的基于拓扑度量的方案，并强调预处理步骤对识别效果的影响。

Oct, 2016

文学社交网络中信息传播的度量

我们提出了文学中信息传播建模任务，并使用一种新的流程在超过5000部小说中分析信息传播动态，发现填补不同社群之间结构空缺的女性角色比男性角色更常见

Apr, 2020

基于循环网络的文本表征

本文研究了如何使用多尺度方法来表征文本结构，进而通过对不同文学体裁作对比分析，使用可达性、对称性和重现度量这些多尺度概念和方法来区分小说和非小说文本的异同。

Jan, 2022

提升作者识别中的表示泛化能力

通过深度学习模型，特别是包含字符 n-grams 和句法信息的模型，学习的表示方式有望提高跨领域的表示泛化能力，从而选择适当的文体特征在不同场景下实现更准确的作者识别。

Sep, 2023

利用现代文学小说中的人物交互图来理解社会结构——有影响力的孟加拉作家的半个世纪编年史

利用角色互动图和自然语言处理派生的特征，对当代文学作品进行社会调查和信息检索。从文学作品构建角色互动图，提取相关图特征，并利用这些特征解决各种现实生活问题。实验评估表明，角色互动图在文学作品的特定评估和信息检索方面具有高度有效性。

Oct, 2023

STONYBOOK：小说大规模分析的系统和资源

本研究通过开发一套资源集合，包括NLP分析工具、清理和注释小说的数据库以及相关的网页接口，来进行大规模小说分析，描述了注释系统的主要功能及其价值，并展示了从网站中获取的分析结果样本，如人物出现和互动的可视化、类似的书籍、代表性词汇、词类统计和阅读难度指数，同时解释了通过注释格式在大型小说语料库中进行定性和定量分析的应用。

Nov, 2023

将风格与实质分开：通过数据选择和展示提升跨类型作者归属

本研究解决了跨主题和跨类型的作者归属问题，提出了针对性的训练数据选择方法和创新学习课程，旨在减少模型对主题信息的依赖而增强对风格信息的识别能力。研究结果显示，该方法在平均跨类型作者归属中实现了62.7%的相对提升，并在每种类型中实现了16.6%的提高。

Aug, 2024

潜在空间解释用于风格分析与可解释作者归属

本文针对现有作者归属方法无法解释的潜在空间表示问题，提出了一种新颖的解释方法，通过识别潜在空间中的代表性点并利用大型语言模型生成各点写作风格的自然语言描述。研究发现，该方法在预测一致性方面优于其他基线，并且通过人类评估验证了风格描述作为潜在空间解释的有效性，帮助提高作者归属任务的准确率，平均提升约20%。

Sep, 2024