半空间深度的精确计算

Nov, 2014

Exact computation of the halfspace depth

Rainer Dyckerhoff, Pavlo Mozharovskyi

TL;DR提出了一种基于理论框架的计算点相对于任意维数的数据云的半空间深度的方法，该方法可导出一整个算法类。这些算法中的深度是在数据云的适当投影相对于有限数量的深度值中最小的计算。对该类算法的三种变体进行了更详细的研究。模拟结果表明，所有的算法都能非常高效地处理不处于一般位置甚至包含平局的数据。

Abstract

For computing the exact value of the halfspace depth of a point w.r.t. a data cloud of $n$ points in arbitrary dimension, a theoretical framework is suggested. Based on this framework a whole class of algorithms

halfspace depth data cloud algorithms projections efficiency

发现论文，激发创造

非凸支持数据的快速核半空间深度

通过在再生核希尔伯特空间中扩展半空间深度来处理分布的多模态性，并证明了该深度的一致性和可靠的浓度界限，从而实现了快速计算半空间深度数倍数量级的性能。

Dec, 2023

关于 Tukey 深度随机近似的质量

图基深度（或半空间深度）是多变量数据的广泛使用的中心度量。然而，精确计算图基深度已知在高维度中是一个难题。作为补救措施，已提出了图基深度的随机近似。在本文中，我们研究了这种随机算法何时能够很好地近似图基深度。我们研究了从对数凹面各向同性分布中抽样的情况。我们证明，如果要求算法在维度上以多项式时间运行，则随机算法正确近似了最大深度 1/2 和接近零的深度。另一方面，对于任何中间深度的点，任何良好的近似都需要指数复杂度。

Sep, 2023

深度统计

论文介绍了数据深度及其在统计学中的应用，包括计算和鲁棒性的差异、中心区域及其在描述数据分布方面的作用，以及对概率分布的扩展和在功能空间中的应用。

Jul, 2012

高维区间搜索的输出敏感工具

论文提出一种基于半空间的点集划分技术及相关算法，能在高维空间中构建浅点集的跨度树并实现半空间范围计数，并在空间和查询时间上具有较好的复杂度。

Dec, 2013

带有机器学习算法描述分析的偏序深度函数

通过深度函数的概念，提出一个分析部分顺序集的框架，并介绍了基于联合无冗余泛型（ufg）深度的机器学习算法比较方法。结果显示，与现有的基准测试方法相比，我们的方法具有显著差异，为分类器比较提供了新的视角。

Apr, 2023

私密中心点与半空间的学习

介绍了针对任意有限域的高维半空间私有学习器，其样本复杂度为 poly (d,2^log*|X|)。其构造是基于在 m 个点中找到近似中心点的差分隐私算法，可用于设计差分隐私算法，并提供了在凸包中查找点的样本复杂度的下界。

Feb, 2019

可解释聚类中深度减少的不可能性

本文研究可解释 K-means 和 K-median 聚类问题，证明了在欧几里得平面上，解释深度降低会导致聚类成本的无界损失，并将其扩展到 K-center 目标。

May, 2023

基于深度截断区域的概率分布伪度量

本文提出了一种新的假距度量方法，该方法使用数据深度来扩展多元分位数的概念，从而度量欧几里得空间上的连续概率分布之间的差异，并通过有限样本破坏点研究了其稳健性。

Mar, 2021

超越径向函数的深度分离

本文通过对深度分离结果的研究，在高维情况下，展示了某些函数可以通过两层神经网络高效近似，但是无法通过单层网络近似，在解决常见的一些函数中出现了限制，并提供了一些方法进行一层网络的高效近似。

Feb, 2021

学习半空间的复杂性理论限制

该研究讨论了在固定且未知的分布和自然条件下的半空间学习问题，证明了最坏情况下的性能和效率的复杂性。

May, 2015