在线测试可交换性的插件马丁格尔
在非独立同分布数据的情景中,我们研究因果效应的估计,重点关注满足独立因果机制假设的可交换数据。为了弥补现有因果效应估计框架的不足,我们开发了针对可交换数据的广义框架,并引入了截断因式分解公式,以促进在我们的情景中对因果效应的识别和估计。为了说明潜在的应用,我们介绍了一个因果泊利亚球模型,并展示了干预在可交换数据设置中如何传播效应。最后,我们开发了一个算法,可以在多环境数据中进行同时因果发现和效应估计。
May, 2024
引入了可交换变量模型 (EVMs) 作为一类新型的概率模型,证明了一族可处理的 EVMs 在零一损失下对于包括奇偶性和阈值函数等大类函数是最优的,并严格包括现有的独立性模型家族,实验证明 EVMs 比仅基于独立性假设的状态艺术分类器如 SVM 和概率模型表现更好。
May, 2014
本文提出一种新的针对预测模型的 Conformal prediction 泛化方法,通过引入加权分位数来抵御数据分布漂移的影响,同时设计一种新的随机化技术,允许不对称处理数据点的算法。实验表明,该方法在数据点不可交换的情况下具有较高的鲁棒性,并且在数据点可交换情况下达到了与现有方法相同的覆盖率保证。
Feb, 2022
本文提出了一种新的偏差不等式,该不等式在多臂赌博模型中采用自适应采样,能够在时间上均匀地适配;利用给定一维指数族中的 Kullback-Leibler 离散度衡量偏差,可以同时考虑几个臂,并且通过构建基于分层先验的混合鞅并相乘这些鞅来获得。我们的偏差不等式允许分析基于广义似然比的序列识别问题的停止规则,并为一些臂的均值函数构建严格的置信区间。
Nov, 2018
研究探讨了机器学习中的问题,特别是当模型在不同于训练数据的数据上进行测试时,模型很容易出现失败的现象,主要依靠发现数据的因果结构、找到可靠的特征并进行推广算法等方面展开探讨。
Mar, 2021
机器学习系统中风险量化与控制的研究,集中在处理 ML 系统收集自身数据时产生的数据分布变化问题,通过扩展 conformal prediction 理论以适应任意数据分布,并提出了针对特定数据分布的可行算法,以解决这一挑战。
May, 2024
我们提出了一个通用的框架,用于构建针对大类非参数测试问题的强大的连续假设检验。该框架可以统一处理多个经典任务,如双样本测试、独立性测试和条件独立性测试,以及现代问题,如对机器学习模型的对抗鲁棒性测试。我们的方法对传统批量测试具有以下优势:1) 它持续监控在线数据流并有效地聚合针对零假设的证据,2) 它在不需要多重测试校正的情况下对类型 I 错误进行严格控制,3) 它根据问题的未知难度调整样本大小要求。我们在测试通过投票框架(testing-by-betting framework)中利用机器学习模型的表示能力方面开发了一种基于原则的方法,这是一种用于设计连续测试的博弈论方法。在合成和真实数据集上的实证结果表明,使用我们的通用框架实例化的测试在多个任务上与专门的基准测试相竞争。
Oct, 2023