极端类别的标记压缩方案

May, 2015

Labeled compression schemes for extremal classes

Shay Moran, Manfred K. Warmuth

TL;DR本研究针对极端分类，基于 Sandwich 定理构建了一个样本压缩方案，其尺寸等于其 VC 维度，并提出了一些有关极端分类的组合结构和无标签压缩方案存在性的问题。

Abstract

It is a long-standing open problem whether there always exists a compression scheme whose size is of the order of the Vapnik-Chervonienkis (VC) dimension $d$. Recently compression schemes of size exponential in $d$ have been found for any concept class of vc dimension $d$. Previously,

compression scheme vc dimension extremal classes sandwich theorem unlabeled compression schemes

发现论文，激发创造

VC 类样本压缩方案

本文提出采样压缩序列作为一种学习算法的抽象形式，并回答了问题：每个概念类别 C 具有 VC 维度 d 的序列都具有指数大小的采样压缩序列，这得益于对 VC 维下二进制矩阵的逼近极小现象。

Mar, 2015

未标记样本压缩方案及其在广泛和最大类别中的应用

该论文研究了机器学习中的组合概念和立体几何领域的拓扑概念之间的联系，并引入了 VC 维和样本压缩方案等概念，提出了一些新的构造和结论。

Dec, 2018

样本压缩的几何方法

本文通过对有限最大概念类的压缩的几何系统性研究，证明了 Piecewise-Linear 超平面排列能够通过等高线法压缩任意有限最大类，从而证明了 Kuzmin 和 Warmuth 的猜想，并说明了一些 d - 最大化类无法嵌入到 VC 维度为 d+k 的任何最大类中。

Nov, 2009

多类可学习性不意味着样本压缩

每个学习二进制假设类都具有有限的 VC 维度且可采用一个与 VC 维度无关的有限函数大小的样本压缩方案，然而，每个学习多类假设类都具有有限的 DS 维度且不具有一个与 DS 维度无关的有限函数大小的样本压缩方案。

Aug, 2023

非离散设置的计算 Vapnik-Chervonenkis 维度

开发了一种在没有约束条件的情况下近似计算 VC 维度的方法，该方法基于经验风险最小化学习范式，用于表征概念类的粉碎性质。

Aug, 2023

用于有向拟阵复合体的带标记样本压缩方案

本文证明了具有 VC 维度 d 的复杂定向基构成的拓扑形态具有大小为 d 的适当编码方法，并且将其拓展到了均匀定向基构成的复杂形态中，这是计算学习理论中最古老的问题之一。利用定向基理论的组合单元结构和将 COM 的拓扑图形看作部分方体，建立了一个与度量图理论之间富有成果的联系。

Oct, 2021

熵与组合维数

通过解决 Talagrand 的熵问题，我们证明了：每个有界函数类的 L_2 覆盖数都与其 shattering 维度成指数关系。这扩展了 Dudley 关于 {0,1} 函数类的定理，对于这些函数，shattering 维度是他们的 Vapnik-Chervonenkis 维度。在凸几何中，这意味着凸体 K 的熵可以由其坐标投影中包含的固定边长的立方体的最大维度控制。该理论有很多后续影响，包括 Elton 的最优定理以及实值情况下统计中心极限定理的估计。

Mar, 2002

任意可计算分类器的统计学习

研究了在所有可计算标签函数中的学习，证明了这是可能的，但也表明了无法独立于分布地限制样本复杂度，这完全是由于学习算法可计算的要求，而不是统计问题的本性。

Jun, 2008

从压缩的角度看统计学习

本文研究了样本压缩方案与统计学习之间的关系，探究了学习能力与可压缩性之间的等价性，并在多类别分类问题中研究了统计学习理论。作者证明了在零 / 一损失分类的情况下，可学习性等价于对数样本大小的压缩，并且一致收敛意味着恒定大小的压缩。作者还探究了在 Vapnik 的一般学习设置下压缩能力与学习能力的等价性，并给出了一些在多类别分类问题中的应用。

Oct, 2016

ImageNet 尺度下的非空泛化界：一种 PAC-Bayesian 压缩方法

本文介绍了现代神经网络的普遍过拟合问题以及如何通过模型压缩来限制模型复杂度，提高模型泛化性能，同时基于对模型压缩技术的分析，提供了在压缩神经网络时的泛化误差界限及给出了实际应用于 ImageNet 分类问题中的第一个非微不足道的可行泛化误差保证。

Apr, 2018