通过集合论理解泛化

Nov, 2023

Understanding Generalization via Set Theory

Shiqi Liu

TL;DR通过集合理论推导和实验，我们对泛化进行定义并提出了一种有效的泛化方法，实验证实了定义的准确性和方法的有效性。

Abstract

generalization is at the core of machine learning models. However, the definition of generalization is not entirely clear. We employ set theory

generalization set theory algorithms hypotheses dataset

发现论文，激发创造

机器学习中的越界泛化

研究探讨了机器学习中的问题，特别是当模型在不同于训练数据的数据上进行测试时，模型很容易出现失败的现象，主要依靠发现数据的因果结构、找到可靠的特征并进行推广算法等方面展开探讨。

Mar, 2021

小型算法数据集上的过度拟合通用化

本文主要研究小规模算法生成数据集上神经网络的泛化能力，探讨数据效率、泛化、学习速度等问题，并阐述了小数据集规模下泛化效果提高的过程、超拟合点后仍可能的泛化提升，以及小数据集可能促进过参数神经网络的泛化能力研究。

Jan, 2022

重新思考泛化需要重新审视旧观念：统计力学方法和复杂学习行为

本文介绍了一种超越当前流行的最坏情况的理论控制框架，重新审视神经网络的统计力学的古老理论，并使用一个名为 VSDL 的模型来描述当算法过早停止或输入加噪声时会增加的温度和减少的数据量对深度神经网络的控制效果，进而提供了关于其过度拟合训练数据、学习算法波动和转变的一种新的定性描述。

Oct, 2017

实验研究的普遍适用性

本文提出了实验研究的数学形式化方法，并发展了一个可量化的泛化概念，旨在探索现有研究的泛化性，并估计实现新研究泛化性所需的实验数量，为此我们应用两个最近发表的基准测试来区分可泛化和不可泛化的结果，并发布了一个 Python 模块，可以用于其他实验研究的分析。

Jun, 2024

鲁棒性和泛化性

基于稳健性的学习算法的普适性界限推导及其稳健性被证明是学习算法发挥作用的基本属性。

May, 2010

重新思考泛化对于了解深度学习至关重要

该研究通过系统实验和理论构建发现，传统方法很难解释为什么大型神经网络的泛化性能良好，即使加入正则化仍然不会改变随机标记训练数据的状态，因为只要参数数量超过数据点数量，简单的两层神经网络就能实现完美的有限样本表达能力。

Nov, 2016

通过可视化理解泛化

本研究探讨神经网络的泛化能力及其背后的原因，通过可视化方法探寻损失景观的几何形状和高维度导致的最优化问题，旨在更加直观地解释泛化现象。

Jun, 2019

神经网络中的泛化：一项广泛调查

本文综述了神经网络模型不同抽象级别的概念、建模方法和最近的研究发现，包括网络模型的概括、分布、域、任务、模式和范围的泛化，着重于在各泛化层次上存在的问题，例如过拟合问题和域适应问题。

Sep, 2022

通过分析学习理论实现机器学习的普适性

本文提出了一种新颖的基于测度论的机器学习理论，不需要统计假设。基于该理论，提出了一种新的深度学习正则化方法，并表明其在 CIFAR-10、CIFAR-100 和 SVHN 中优于之前的方法。此外，该提出的理论为深度学习中的一族实际成功的正则化方法提供了理论基础。与统计学习理论不同，该提出的学习理论通过测度论分析每个问题实例，而不是通过统计分析一组问题实例，因此提供了不同类型的结果和见解。我们还讨论了该结果对一次性学习、表示学习、深度学习和课程学习的几种后果。

Feb, 2018

系统性归纳的简要调查

本研究系统地总结了机器学习中的系统化推广方法，并从经典派和联结派等不同角度介绍了其相关信息。我们重点讨论了不同类型的联结派及其如何处理推广问题，并探讨了在语言、视觉和 VQA 等领域中的应用。此外，我们还讨论了相关的变量绑定和因果问题，并简要介绍了最新的研究进展，希望能为未来的研究提供一定的背景和参考。

Nov, 2022