指数分布族在线密度估计的相对损失界限
本文探讨通过从一组分布中选择一种密度估计来最小化到未知分布的L1距离的问题,并分析了两种算法:Scheffe锦标赛赢家和最小距离估计。研究者提出了两种新算法来解决计算密度估计的问题,并探讨了随机算法的应用。
Dec, 2007
提出了一种高度有效的算法,该算法能够学习近似于分段多项式密度函数的单变量概率分布,并应用于密度估计问题,涉及混合对数凹分布、混合$t$峰态分布、混合单峰风险率分布、混合二项式泊松分布、混合高斯分布和混合$k$单调密度等问题。
May, 2013
本文提出了一种高效的基于变宽直方图的密度估计算法,通过使用该算法对来自 $p$ 的独立同分布采样,可以输出一个分段常数概率密度函数作为假设分布,并且在样本规模和运行时间上达到最优,其中总变差距离满足一定的误差限制。
Nov, 2014
本文首次表征凸形 ERM 在高维广义线性模型推断中的基本统计精度界限,推导出任意损失函数和正则化参数值的紧凑下界,并精确评价了损失函数和正则化参数值的优化调整。
Jun, 2020
本文提出了基于最大熵的随机和符号密度估计方法,该方法通过符号梯度流从样本中恢复概率密度函数,进而通过构建由样本猜测符号表达式的梯度漂移扩散过程并解决用样本的矩所构建的线性方程组,找到猜测分布为最大熵形式时分布的参数,使用符号回归找到最优基函数以提高极大熵函数的指数的条件数,该方法在计算代价方面具有优势。
Jun, 2023
在本文中,我们提出了一种新的损失函数和一种计算高效的估计器,它在温和条件下是一致且渐近正态的。我们将我们的方法视为同一类指数族的重新参数化分布的最大似然估计,并证明我们的估计器可以解释为最小化特定的Bregman得分以及最小化代理似然的实例。同时,我们还提供了有限样本保证,以在参数估计中实现误差(在ℓ₂范数中)为α,样本复杂度为O(poly(k)/α²)。当定制为节点稀疏马尔可夫随机场时,我们的方法实现了O(log(k)/α²)的优化样本复杂度。最后,我们通过数值实验展示了我们估计器的性能。
Sep, 2023
使用Wasserstein距离对分布进行差分私密密度估计,并设计了可以适应简单实例的实例最优算法,对于特殊情况下的离散分布,结果还导致了TV距离下的实例最优私密学习。
Jun, 2024
本研究解决了在未知集合 $S$ 中的样本情况下,如何有效估计分布参数的问题。我们提出了一种新的算法,能够在多项式时间内估计任意高斯分布和线性回归的参数,尤其在样本被截断的情况下。研究的结果不仅解决了高斯分布的参数估计问题,还为多种经验族提供了处理方法,具有重要的应用潜力。
Oct, 2024
本研究解决了密度比估计中的$L_p$误差界限问题,提出了基于$f$-散度损失函数的新视角。研究表明,对于任何利普希茨连续估计器,$L_p$误差的上下界与数据维度以及密度比的期望值有关,尤其是在$K$-发散度较大时,误差显著增加。该理论结果通过数值实验加以验证,具有重要的理论意义和实际应用潜力。
Oct, 2024