- 通过共因原则解决辛普森悖论
辛普森悖论中,随机变量与共因变量的关系建立在共同原因的条件下,而非辖权化。对于一个最小的共同原因,应选择辛普森悖论的条件分布选项,而不是辖权化。对于三元(未观察到)的共同原因,辛普森悖论的三个选项都可能存在,需根据共同原因的先验信息选择正确 - 广义 Wick 分解
我们回顾了累积分解和 Wick 分解,然后将每个分解推广到一个任意函数的新分解。
- 随机变量与其主成分之间的相关性
使用线性代数的向量和矩阵概念,从个体随机变量的统计信息出发,找到了与这些统计信息相关的一组随机变量的等效统计信息,得到了描述随机变量与代表它们的主成分间相关系数的代数公式。该公式与因子分析中用于计算因子载荷的公式相同,可以用于优化主成分分析 - 深度少样本元学习的层次贝叶斯模型
我们提出了一种新的层次贝叶斯模型,可用于针对大量(可能是无限)任务 / 情节进行学习,适合 few-shot 元学习问题。
- 混合概率逻辑编程:推理和学习
本文研究了概率逻辑编程,扩展了支持离散和连续随机变量,并引入了新的采样算法和混合模型,解决了从带有缺失值和概率背景知识的关系数据中学习 PLP 的问题。
- ICML通过演变离散化实现更快的隐私账户
本论文介绍了一个新算法,用于计算隐私随机变量的数字组成,可用于计算机制的组合的准确差分隐私参数。该算法可以在多项式对数 (k) 的时间和内存使用情况下自我组合机制 k 次。该方法不仅适用于子采样高斯机制等广泛机制的分析,还可扩展至组合同类别 - 基于约束条件从少样本图中学习因果结构
该研究论文提出了一种利用约束编程方法结合先前知识和理论洞见的实用方法,从而解决了时间序列数据中因果学习算法估计的图形结构提供高度误导性因果信息的问题,并且可以扩展到大型随机变量集合,并不需要精确知道时间尺度差异。
- Jaccard 指数的进一步推广
对 Jaccard 指数及其相关的一些扩展进行理论研究,包括一种新的巧合指数,该指数在比较两个实体集时可以考虑相对内含度的水平,适用于连续向量空间、多重集、密度和通用标量场的扩展,以及量化两个随机变量之间的联合相互依赖性的方法。
- KDD从观察数据中推断因果方向:复杂性方法
通过在离散或连续随机变量之间预测因变量来区分因果关系,我们提出了多个简单快速的标准,以检验因果关系,适用于广泛的因果机制和数据噪声类型。
- ICML有界随机变量的接近最优置信区间
本研究提供了一种基于 Bentkus 集中结果的近乎最优置信序列,用于解决在线推断中随着样本大小不断增长需要统一有效置信区间的问题,证实这种置信序列在合成覆盖问题和自适应停止算法方面具有优越性。
- Multinoulli 随机变量的浓度不等式
研究 Dirichlet 和 Multinomial 随机变量的浓度不等式。
- 信息泄漏的操作方法
本文旨在量化信息的流失,从而定义最大泄漏等概念,研究了采用最大泄漏方式的密码方案,并推导了最佳限制以及样本复杂度。同时,使用存在猜测的框架为香农容量,最高相关性和局部差分隐私等常用泄漏度量提供了操作性的解释。
- 具有连续随机变量和递归的概率语言的上下文等价性
我们提出了一个完整的论证原则,用于解决无类型的概率编程语言中的语境等效性问题,并证明了概率编程中的上下文等效性。
- ICMLJointGAN: 用生成式对抗网络实现多领域联合分布学习
开发了一种新的生成对抗网络,用于联合分布匹配,并能够从多个随机变量中学习联合分布,同时学习采样每个单独领域的边缘分布和领域间的条件分布,该框架由多个生成器和一个基于 Softmax 的评论家组成,并通过对抗性学习进行联合训练。
- ICML二进制随机变量的学习科尔莫戈洛夫模型
该研究提出了一个基于 Kolmogorov 模型的学习框架,通过从数据中提取有价值的关系,推导了一些特定随机变量的结果之间的联系,并提出了一个算法来计算该模型,并展示其一阶最优性,尽管学习问题具有组合性质。该算法可以应用于推荐系统和其他场景 - 关于随机变量的指数型 Orlicz 空间类中范数的研究
本文给出了所生成的指数型 Orlicz 空间的新特征,定义了属于其中心随机变量的范数,并在概率上下文中介绍了这些范数的一些应用,包括 Luxemburg 范数和 Hoeffding 不等式。
- 超平面截断多元正态分布的快速模拟
提出了一种快速易实现的模拟算法,用于多元正态分布受截断的超平面交集限制,进一步将其推广,以有效地模拟方差(精度)矩阵可分解为正定矩阵减去(加上)低秩对称矩阵的多元正态分布的随机变量。举例说明了所提出的模拟算法的正确性和效率。
- 马尔可夫决策过程中的分布鲁棒对应物
本文研究了参数不确定的马尔可夫决策过程,利用分布鲁棒优化框架来得到在最具有敌意的分布下的最大性能期望值。通过将不确定参数视为随机变量,本文泛化了以前的研究并证明,在较温和的技术条件下,可以高效地获得最优策略,这极大地扩展了分布鲁棒 MDP - 样本协方差矩阵最小特征值的下界
本研究推导了一个中心各向同性随机向量的样本协方差矩阵最小特征值的下界,即使对其构成部分没有强假设或无假设时也成立。
- 估计最大期望值:(嵌套)交叉验证和最大样本平均值的分析
研究通用的随机变量最大期望值的两种常见估计量的准确性:最大样本平均值的一般化和交叉验证。通过研究和限定上述估计量的偏差和方差,并证明了其一致性。交叉验证的方差可以显著减小,但风险是引入大偏差;交叉验证不同变体的偏差和方差因问题而异,选择错误