提出一种基于极大似然拟合和基于 Kolmogorov-Smirnov 统计量和似然比检验的拟合优度检验方法,用于鉴别和量化实验数据中幂律行为,并在 24 个不同领域的数据集上进行了测试。
Jun, 2007
本研究采用最大似然拟合、基于 Kolmogorov-Smirnov 拟合度量的假设检验和可能性比检验等方法,针对实际的具有重尾性状的 12 个不同数据集进行分析,以评估用于有所不同的描述方式下的第三方统计学中有关幂律分布的假设检验的效果,并量化了数据划分所导致的统计功率损失。
Aug, 2012
通过回顾一些关于幂律形式的存在以及旨在解释它们的理论,我们研究了数量的测量概率随其值的变化而呈幂反比分布的幂律、Zipf 定律或 Pareto 分布在多个学科领域的出现。
Dec, 2004
通过随机复合动力学,我们研究了多自由度随机系统中的多项式随机过程,通过单粒子分布引导出的 Boltzmann 分布。通过 Monto Carlo 模拟和实验数据验证了这种机制,并推测通过这种机制可以自然产生临界状态和分层结构。
Jul, 1996
本文介绍一种称为 “partial logarithmic binning” 的方法,该方法能够检测信息科学中许多分布所呈现的特征。文章指出,用次方方法处理数据可以让我们观察到无噪音情况下的实际呈现形式。除了通常采用的 MLE 方法,简单最小二乘的处理方法有时更为适用。本文还讨论了累积分布函数难以准确获得干净的特征,因而使得获得指数的精确值变得困难的问题。本文非技术性,适合没有数学背景的信息科学研究者。
Nov, 2010
通过改进方法,利用贝叶斯推断来获得准确的估计和可信区间,以提高拟合度分布检验的可靠性。探究了网络或其他数据集是否遵循幂律分布,并将该方法应用于合成网络和实际网络的分析中。结果表明该方法更加适用于实际情况。
Nov, 2023
通过研究三种版本的 Zipf 定律并将它们拟合到 Project Gutenberg 数据库中所有可用的英文文本中,我们发现其中一种版本的 Zipf 定律在整个频率域内(从 1 到最大值)仅用一个自由参数就能拟合数据库中超过 40%的文本。
Sep, 2015
该研究考察了一种新的随机微分方程 —— 称为幂律动力学 —— 以及它的平稳分布和遗传时间,证明了在学习速率足够小的情况下,该幂律动力学是遗传的且具有唯一的平稳分布。
Jun, 2023
使用幂律缩放在深度学习中有助于处理当前人工智能应用中的关键挑战,可用于测量训练复杂性和机器学习任务算法的量化层次,并建立数据集大小估计的基准以实现期望的测试准确性。
Nov, 2022
通过研究幂律分布的性质以及当群体有限且等级和数量为自然数时出现的类似分布,讨论了 Zipf 定律的解释存在的问题,揭示了一些 Big Data 中的现象是大量数据的性质所引起的。
May, 2023