通过统计分析单词关联、WordNet 和 Roget's thesaurus 三种语义网络的大规模结构,我们发现这些网络均具有小世界结构、幂律分布,而对于语义组织,这种结构不同于传统模型,我们提出一个简单的语义增长模型来解释这一现象并考虑了学习历史变量对行为表现的影响。
Oct, 2001
从复杂性科学的角度总结了自然语言研究中使用的主要方法概念,并记录了这些方法在识别语言的通用和系统特征方面的适用性。讨论了数量语言学中三个与复杂性相关的研究趋势,包括对文本中单词频率的研究、基于时间序列分析的方法应用于研究书面文本中的相关性、以及将网络形式主义应用于自然语言研究中。
Jan, 2024
该研究运用复杂网络理论探究文本语言特性,并通过生长网络模型验证存在顶点功能分类和不同层次的顶点相关性,展示出类似于句法结构的网络结构。
May, 2006
本文介绍了使用基于角色网络的文本聚类方法,利用 DraCor 数据库下载的戏剧文本,在 R 中进行分析后使用基于统计学的方法,如支持向量机来对喜剧和悲剧进行分类,并且表明这种方法在小样本量情况下也可以产生可靠的结果。
Feb, 2023
论文研究网络分类问题,使用实际网络和人工生成的图模型,证明不同领域的复杂网络有着独特的结构属性,并能够使用少量简单的结构属性予以预测其类别。
May, 2018
研究了 ConceptNet 定义的由 11 种不同语言的七个语义关系组成的语义网络的特性,发现它们普遍具有稀疏、高度聚集和幂律程度分布等基本属性,少数语言的语义网络由于语法规则的影响出现幂律分布中的峰值。此外,根据语义关系类型和语言不同,语义网络中连接的形成受不同原则的指导,利用语义网络中相似性和互补性知识,可以提高 NLP 算法中的缺失链接推断。
Apr, 2023
本研究关注于网络系统的统计特性,特别是网络的小世界属性、幂律度分布、网络传递等特性。我们还提出了一种新的方法来检测紧密结合的节点组成的社区结构,使用中心性指数来确定社区边界。我们在计算机生成的和真实世界的图上测试了该方法,并发现它以高度的灵敏度和可靠性检测出社区结构。我们还将该方法应用于两个社区结构不好知道的网络 - 一张协作网络和一张食物网络,并发现它在两种情况下都能检测出有意义的社区划分。
Dec, 2001
本研究旨在探讨社交网络结构对词汇变化的影响,通过对 4420 个在线社区在 10 年内发生的 80,000 个新词汇的大规模分析,使用泊松回归和生存分析,发现社区的网络结构对词汇变化起着显著作用,特别是密集连接,缺乏本地集群和更多的外部联系对推动词汇创新和保留具有促进作用,同时这些基于主题的社区不会像线下社区一样经历强烈的词汇调整,而是容纳更多的小众词汇。
Apr, 2021
本文介绍了一种分析交织在一起的重叠社区的方法,以揭示复杂网络的模块化结构。经过定义一组新的特征量进行统计分析,发现网络中的重叠显著,并揭示出网络的普遍特征。通过对合作,词汇关联和蛋白质相互作用图的研究表明,社区网络具有非平凡的相关性和特定的比例关系。
Jun, 2005
本研究提出一种新的 FERMULEX 结构,通过多维度特征嵌入来丰富词义。我们运用该网络结构,研究了 1000 位 18-30 个月大的幼儿语言习得中的词汇选择偏好和语法建构,并发现其非均匀和规律性的演化过程。研究结果支持了以往的实证研究和发展性理论。
Jan, 2022