个体数据通用监督学习

Dec, 2018

Universal Supervised Learning for Individual Data

Yaniv Fogel, Meir Feder

TL;DR本文从信息论的角度探讨了通用监督学习问题，提出了一个名为 Predictive Normalized Maximum Likelihood (pNML) 的学习方案，并证明其在特定测试任务的学习能力超过了当前基于经验风险最小化 (ERM) 的领先方法。

Abstract

universal supervised learning is considered from an information theoretic point of view following the universal prediction approach, see Merhav and Feder (1998). We consider the standard supervised "batch" learning where prediction is done on a test sample once the entire training data

universal supervised learning information theory self-information loss predictive normalized maximum likelihood empirical risk minimization

发现论文，激发创造

深度 pNML：深度神经网络的预测性归一化最大似然

研究了深度神经网络模型类中预测归一化极大似然（pNML）方案及其相关可学习性度量，发现在对抗攻击方面具有鲁棒性，可用于检测样本类别分布不均、噪声标签等情况，且可作为基准学习者竞争的学习器生成 “两次通用” 的解决方案。

Apr, 2019

一种新的旧问题视角：线性回归的通用学习方法

通过通用学习的角度重新审视线性回归问题，研究了标签 y 和特征向量 x^T 的线性组合表达式及其学习可行性，证明在训练数据的相关矩阵特征向量构成的子空间上，即使参数个数 M 多于样本个数 N，线性回归也可以具有很好的推广性能。

May, 2019

基于离线模型的正态化最大似然估计优化

本文提出了在数据驱动的优化问题中利用归一化极大似然估计器解决不确定性和变化范围问题的方法，并通过在各个领域（如化学、生物学和材料工程）的高维设计问题中进行的实验验证了该方法的有效性。

Feb, 2021

在规格不匹配设定下的通用批次学习

在该论文中，我们考虑了在误差设置下的通用批次学习问题，其中假设类是一个模型集合，但数据是由未知分布生成的，可能不属于该集合，而是来自一个更大的模型集合。我们利用极小极大定理和信息论工具，推导出最优的通用学习器，即数据生成分布集合上的混合分布，获得了最小最大遗憾的闭式表达式。我们发展了一种扩展的 Arimoto-Blahut 算法用于遗憾值和达到容量的先验分布的数值评估。对于观测结果来自 K 个参数的多项式分布，而假设类是该分布族的子集的情况，我们展示了我们的结果。

May, 2024

通用预测器学习

通过元学习的极限来将 Solomonoff 归纳嵌入到神经网络中，利用 Universal Turing Machines 生成训练数据，研究了元学习的极限以及其对神经网络的影响，实验结果表明 UTM 数据对于元学习是一个有价值的资源，并且可以用来训练具备学习通用预测策略能力的神经网络。

Jan, 2024

不确定的自然语言推断

本文介绍了不确定的自然语言推断（UNLI），它是自然语言推断（NLI）的一种改进，通过预测主观概率评估来预测结果，利用概率评估重新标记了部分 SNLI 数据集，并使用现有的分类标签化的 NLI 数据进行预训练，最终模型展示了超越分类标签化的 NLI 任务的更微妙推断的人类表现水平。

Sep, 2019

神经群体 Infomax 快速稳健非监督学习的信息论框架

提出了一种基于 infomax 原理的框架，可实现对大规模神经群体进行无监督学习。该方法使用基于渐近的方法来对大规模神经群体的信息论下限进行计算，通过渐进性的不断往全局信息论最优解靠近的过程，可以获得一个很好的初始值。基于该初始值，提出了一个高效的算法来从输入数据集中学习特征表示，并且该方法适用于完备、过完备和欠完备情况下的基函数。和现有的方法相比，该算法在无监督表示学习的训练速度和鲁棒性方面都具有明显的优势，而且还可以轻松地扩展到用于训练深层结构网络的监督或无监督模型。

Nov, 2016

优化线性信号：一种用于优化线性信号的无监督机器学习框架

这项研究提出了一种无监督机器学习方法来优化量化金融中的盈亏（Profit and Loss）。我们的算法类似于无监督线性回归，通过线性组合外生变量构造的信号，最大化盈亏的夏普比率。该方法利用外生变量与交易信号之间的线性关系，通过参数优化来最大化夏普比率。在代表美国国债的 ETF 上的实证应用展示了模型的有效性，并通过正则化技术来减少过拟合。研究总结了进一步发展的潜在方向，包括广义时间步长和增强校正项。

Nov, 2023

从聚合观察中学习

本文提出了一个概率框架，将多实例学习扩展到多类分类和回归等其他问题，并引入一种新的一致性概念来表征估计器，证明了在温和的假设下具有良好的收敛性。实验证明，该方法在三种问题设置中具有有效性。

Apr, 2020

正负样本学习与 PU 学习的理论比较

本文主要探讨 PU（和 NU）学习相对于 PN 学习的上界估计误差，并发现了简单的条件，当先验概率和 P 与 N 数据的大小给定时，PU 或 NU 学习具有无限 U 数据将优于 PN 学习。

Mar, 2016