在线测试可交换性的插件马丁格尔

ICMLApr, 2012

在线测试可交换性的插件马丁格尔

Plug-in martingales for testing exchangeability on-line

Valentina Fedorova, Alex Gammerman, Ilia Nouretdinov, Vladimir Vovk

TL;DR本文致力于在线测试数据交换性假设，通过构造交换性鞅并提供一些新的方法来测试其假设。我们的鞅方法与之前介绍的假设检验方法相比具有更高的灵活性，在 USPS 和 Statlog 卫星数据两个基准数据集上取得了良好的结果。

Abstract

A standard assumption in machine learning is the exchangeability of data, which is equivalent to assuming that the examples are generated from the same →

machine learning exchangeability probability distribution martingales benchmark datasets

发现论文，激发创造

测试随机性

本文通过回顾已知的在线检验方法，重点研究基于依从性鞅的方法，强调了概念和实践方面，并阐述了有效性和效率方面的结果。

Jun, 2019

重训练或不重训练：用于变点检测的一致性测试鞅

本文介绍了一种基于交换鞅的策略来检测数据分布变化的算法训练方案，并基于符合性预测提出了一种通用的预测算法重新训练方法，初步探讨了其效率。

Feb, 2021

通过交换性实现可处理性：高效概率推断的新视角

论文研究了有限可交换性及其与可计算概率推断的关系，并指出现有的升级推理算法隐含着条件独立和部分可交换性的结合。

Jan, 2014

Do Finetti：对可交换数据的因果效应研究

在非独立同分布数据的情景中，我们研究因果效应的估计，重点关注满足独立因果机制假设的可交换数据。为了弥补现有因果效应估计框架的不足，我们开发了针对可交换数据的广义框架，并引入了截断因式分解公式，以促进在我们的情景中对因果效应的识别和估计。为了说明潜在的应用，我们介绍了一个因果泊利亚球模型，并展示了干预在可交换数据设置中如何传播效应。最后，我们开发了一个算法，可以在多环境数据中进行同时因果发现和效应估计。

May, 2024

可交换变量模型

引入了可交换变量模型 (EVMs) 作为一类新型的概率模型，证明了一族可处理的 EVMs 在零一损失下对于包括奇偶性和阈值函数等大类函数是最优的，并严格包括现有的独立性模型家族，实验证明 EVMs 比仅基于独立性假设的状态艺术分类器如 SVM 和概率模型表现更好。

May, 2014

超越交换性的合拍预测

本文提出一种新的针对预测模型的 Conformal prediction 泛化方法，通过引入加权分位数来抵御数据分布漂移的影响，同时设计一种新的随机化技术，允许不对称处理数据点的算法。实验表明，该方法在数据点不可交换的情况下具有较高的鲁棒性，并且在数据点可交换情况下达到了与现有方法相同的覆盖率保证。

Feb, 2022

混合鞅方法的再探讨及其在序列检验和置信区间中的应用

本文提出了一种新的偏差不等式，该不等式在多臂赌博模型中采用自适应采样，能够在时间上均匀地适配；利用给定一维指数族中的 Kullback-Leibler 离散度衡量偏差，可以同时考虑几个臂，并且通过构建基于分层先验的混合鞅并相乘这些鞅来获得。我们的偏差不等式允许分析基于广义似然比的序列识别问题的停止规则，并为一些臂的均值函数构建严格的置信区间。

Nov, 2018

机器学习中的越界泛化

研究探讨了机器学习中的问题，特别是当模型在不同于训练数据的数据上进行测试时，模型很容易出现失败的现象，主要依靠发现数据的因果结构、找到可靠的特征并进行推广算法等方面展开探讨。

Mar, 2021

对于任何数据分布，存在一致有效性保证

机器学习系统中风险量化与控制的研究，集中在处理 ML 系统收集自身数据时产生的数据分布变化问题，通过扩展 conformal prediction 理论以适应任意数据分布，并提出了针对特定数据分布的可行算法，以解决这一挑战。

May, 2024

深度实时假设测试

我们提出了一个通用的框架，用于构建针对大类非参数测试问题的强大的连续假设检验。该框架可以统一处理多个经典任务，如双样本测试、独立性测试和条件独立性测试，以及现代问题，如对机器学习模型的对抗鲁棒性测试。我们的方法对传统批量测试具有以下优势：1) 它持续监控在线数据流并有效地聚合针对零假设的证据，2) 它在不需要多重测试校正的情况下对类型 I 错误进行严格控制，3) 它根据问题的未知难度调整样本大小要求。我们在测试通过投票框架（testing-by-betting framework）中利用机器学习模型的表示能力方面开发了一种基于原则的方法，这是一种用于设计连续测试的博弈论方法。在合成和真实数据集上的实证结果表明，使用我们的通用框架实例化的测试在多个任务上与专门的基准测试相竞争。

Oct, 2023