引文网络主题模型的文献分析
采用随机块模型方法,针对主题建模中存在的问题,提出了一种更具通用性和原则性的框架,该框架能够自动检测主题数和分级群集单词和文档,从而比 LDA 在统计模型选择方面提供更好的主题模型。
Aug, 2017
本文综述了科学演化模型的重要工作,然后介绍了一般的过程模型,该模型同时生成了共同作者和论文引用网络,该模型通过主题划分作者和论文、作者引用最新论文以及作者引用已阅读论文引用的论文来模拟论文引用网络的统计和动态性质,并将其验证为线性关系数的主题与模拟论文引用网络的聚类系数相关。
Nov, 2003
我们介绍了作者 - 主题模型,它是一种生成文档的模型,扩展了隐含狄利克雷分配(LDA),包括作者信息,应用于 NIPS 会议论文和 CiteSeer 摘要,具有估算主题和作者分布的 Gibbs 采样基础上的性能比较。
Jul, 2012
Latent Topical-Authority Indexing is proposed as a way to jointly model the topics, citations, and topical authority in a corpus of academic papers to differentiate authority based on research topics, and it achieves improved accuracy over other similar models when predicting words, citations, and authors of publications.
Jun, 2017
通过分析他人对目标文章贡献的观点以及引文摘要网络的聚类方法,我们提出了一种用于凝练文章的模型,该模型可进一步用于概括一个整体研究领域,从而帮助研究人员快速了解新研究领域。
Jul, 2008
提出了一种综合映射和聚类的方法,旨在将映射和聚类技术有机地结合起来,从而更好地分析文献计量网络。作者使用 VOS 映射技术和加权参数化的基于模块性的聚类技术来说明该方法,最终针对信息科学领域 1999-2008 年最常被引用的论文进行了综合映射和聚类分析。
Jun, 2010
这篇论文主要介绍了如何使用无限作者主题模型(Infinite Author Topic)来解决传统主题模型中难以确定主题数量的问题,并通过 Gamma-Negative Binomial Process 和 Gibbs Sampling Inference Algorithm 来实现对主题、作者兴趣和文本数据的学习。
Mar, 2015
利用复杂网络的概念和方法,研究关键词识别、自动提取摘要和作者归属等自然语言处理任务中的模式识别技术,提出了基于功能词重复模式的作者归属任务,运用机器学习方法对其进行验证,结果表明模式能够区分不同作者的写作风格,并推荐将其应用于其他相关的语言任务。
Jul, 2016
Twitter 数据由于其形式和语言的不规整性,在当前的主题建模中很难处理。针对该问题,提出了基于 Twitter-Network(TN)主题建模方法,该方法结合文本和社交网络全面应用贝叶斯非参数方法。使用层级泊松 - 狄利克雷过程(PDP)进行文本建模和高斯随机函数模型进行社交网络建模。结果表明,TN 主题模型的灵活性使其明显优于现有的非参数模型,同时提供了作者兴趣、hashtag 分析等信息推断,以及进一步的应用,如作者推荐、自动主题标注和 hashtag 建议。
Sep, 2016
该研究提出了一种基于内容的方法来推荐论文草稿中的引用,通过将请求文档嵌入到向量空间中,再使用其最近邻作为候选项,并使用区分观察和未观察到的引用的判别模型对候选项进行重新排序,无需元数据,得到了相对于标准数据集的显著提升。
Feb, 2018