通过在再生核希尔伯特空间中扩展半空间深度来处理分布的多模态性,并证明了该深度的一致性和可靠的浓度界限,从而实现了快速计算半空间深度数倍数量级的性能。
Dec, 2023
图基深度(或半空间深度)是多变量数据的广泛使用的中心度量。然而,精确计算图基深度已知在高维度中是一个难题。作为补救措施,已提出了图基深度的随机近似。在本文中,我们研究了这种随机算法何时能够很好地近似图基深度。我们研究了从对数凹面各向同性分布中抽样的情况。我们证明,如果要求算法在维度上以多项式时间运行,则随机算法正确近似了最大深度 1/2 和接近零的深度。另一方面,对于任何中间深度的点,任何良好的近似都需要指数复杂度。
Sep, 2023
论文介绍了数据深度及其在统计学中的应用,包括计算和鲁棒性的差异、中心区域及其在描述数据分布方面的作用,以及对概率分布的扩展和在功能空间中的应用。
Jul, 2012
论文提出一种基于半空间的点集划分技术及相关算法,能在高维空间中构建浅点集的跨度树并实现半空间范围计数, 并在空间和查询时间上具有较好的复杂度。
Dec, 2013
通过深度函数的概念,提出一个分析部分顺序集的框架,并介绍了基于联合无冗余泛型(ufg)深度的机器学习算法比较方法。结果显示,与现有的基准测试方法相比,我们的方法具有显著差异,为分类器比较提供了新的视角。
Apr, 2023
介绍了针对任意有限域的高维半空间私有学习器,其样本复杂度为 poly (d,2^log*|X|)。其构造是基于在 m 个点中找到近似中心点的差分隐私算法,可用于设计差分隐私算法,并提供了在凸包中查找点的样本复杂度的下界。
Feb, 2019
本文研究可解释 K-means 和 K-median 聚类问题,证明了在欧几里得平面上,解释深度降低会导致聚类成本的无界损失,并将其扩展到 K-center 目标。
May, 2023
本文提出了一种新的假距度量方法,该方法使用数据深度来扩展多元分位数的概念,从而度量欧几里得空间上的连续概率分布之间的差异,并通过有限样本破坏点研究了其稳健性。
Mar, 2021
本文通过对深度分离结果的研究,在高维情况下,展示了某些函数可以通过两层神经网络高效近似,但是无法通过单层网络近似,在解决常见的一些函数中出现了限制,并提供了一些方法进行一层网络的高效近似。
Feb, 2021
该研究讨论了在固定且未知的分布和自然条件下的半空间学习问题,证明了最坏情况下的性能和效率的复杂性。
May, 2015