- 快速可扩展的贝叶斯 AB 测试
通过使用分层贝叶斯估计方法,我们提出一种解决 AB 测试分析中常见限制的解决方案,包括多因素和因素之间的相关性、早期停止的顺序测试和从过去测试中提取综合全球学习的能力。通过数值模拟和大量实际 AB 测试,我们证明了这种方法的实际价值。
- 非模型广义基准推断
基于可靠性和可问责性的指导原则,本文提出了一种模型无关的统计框架,用于不确定性量化和统计推断,通过预测集提供可控制第一类错误的有限样本控制方法,并提供了灵活的工具用于不确定性概率推理。
- 算法公平监控
本文介绍了一种基于统计推断的系统的运行时监测技术,该系统具有未知的结构但是被假定为具有马尔可夫链结构。我们引入了一种规范语言,可以模拟许多常见的算法公平性属性,例如人口平均,平等机会和社会负担。使用原型实现,我们展示了如何监测银行在不同社会 - 利用 Lasso 实现签名一致性
本文研究了在 Lasso 回归中使用 signature transforms 的一致性问题,指出对于具有较弱跨维关联的过程和时间序列,其由 Itô 积分定义的 Signature 变换更一致,而对于均值回归过程和时间序列,其由 Strat - 材料信息学: 一种算法设计规则
研究论文介绍了材料信息学作为一种第四范式的材料科学研究方法,并通过应用多种神经网络拓扑结构、逻辑公理和推理信息科学,发展出了面向半导体工业的新型有机半导体发现的数据驱动程序,并为材料科学界提供了知识提取。
- 机器学习模型是否具备常识学习能力?
本文提出了一种框架,用于从模型的训练数据中推导出共识规则,进而量化模型学习共识的程度。通过使用基于逻辑的方法和统计推断,可以无需监督学习的方式推导出分布在数据中的共识规则,并通过测试时间适应来减少共识规则违例和产生更加连贯的预测结果。在三个 - ICLR机器学习研究的推断可再现性
本研究探讨了机器学习模型评估的可靠性,提出了使用线性混合效应模型的方法,以分析性能评估分数,并使用广义似然比检验进行统计推断。同时,本文还探讨了数据属性与算法噪声因素之间的相互作用,以及噪声源对整体方差的贡献和可靠性系数的计算方法。
- 预测驱动的推论
提出了一种利用机器学习进行预测的统计推断框架,可有效计算均值、分位数、线性和逻辑回归系数的置信区间,适用于蛋白质组学、基因组学等多种领域。
- ICLR可解释性作为统计推论
通过统计推断方法构建了一种概率模型,通过学习模型参数和使用神经网络选择器来实现解释性预测,并利用新数据集进行了实验验证,证明了使用多重插补提供了更合理的解释。
- 用于统计假设测试程序的声音且相对完全的信念 Hoare 逻辑
提出一种新的方法来正式描述统计推断的要求并检查程序是否正确使用了统计方法。具体来说,定义了信仰 Hoare 逻辑(BHL)以形式化并推理通过假设检验获取的统计信念。证明了 BHL 对于应用在假设检验方面的问题很有用,对于合理的统计推断解释中 - KDD超图的核心 - 边缘模型
本研究提出了随机超图模型来描述核 - 外围结构,并基于模型的充分统计量开发了一种新的统计推断算法,能够扩展到具有大量超图节点的情况,并具有可扩展的采样算法。我们的推断算法能够学习到对应于超图中节点声誉(排名)的嵌入。此外,我们还给出了我们的 - 使用得分匹配模拟扩散跃点
本文提出了一种基于反向时间表示的扩散桥模拟方法,通过变分公式学习时空逆转实现扩散桥的模拟,并通过评分匹配方法克服其不可计算性,提出了一种近似 Doob's h - 变换法的方法,实验结果表明了此方法的有效性。
- 利用 M - 估计器对自适应收集数据进行统计推断
本论文通过理论分析,提出了一种基于 M - 估计量的方法,利用自适应算法(包括习得算法和最大似然算法)处理 bandit 算法采集的数据,进而构建了一种渐进有效的置信区间方法,可用于许多统计推断目标。
- KDD非参数生存分析用于长期管道失效预测
使用机器学习技术,基于水管历史故障记录、管道和环境因素描述进行评估和预测,开发了一种非参数生存分析技术 Random Survival Forest,能够更好地预测水管故障率,并利用统计推断技术量化了长期预测的不确定性。
- 从阴影中推断形状、照明和反射
本文研究计算机视觉中的一个基本问题,即如何从平面图像中推断出世界的内在 3D 结构,并提出一种统计推断的优化问题,通过考虑表面光滑、颜色均匀、光照自然等先验知识,提出一种能够从单张图像中还原场景属性,包括形状、反射率和光照等的技术。该方法包 - 网络背书动态中的层次结构出现
本研究介绍了一种基于时间变化的网络的生成模型,能够产生一系列从平等主义到双稳态等级制度,并通过对聘用模式、统治关系和友谊网络等社会和生物系统进行应用,观察到几种持久模式以及每种模式所喜欢的生成机理的可解释性差异,并支持使用数据进行原则性比较 - Wasserstein 空间中的统计数据分析
本文介绍利用 Wasserstein 距离和最优输运理论分析数据集中随机概率测度(如多重直方图或点云)的最新统计学贡献,并重点介绍在 Wasserstein 空间中使用重心和测地线 PCA 的好处,用于学习数据集中几何变化的主要模式。同时, - GraSPy: Python 中的图统计
介绍了一个名为 GraSPy 的 Python 图形库,用于统计推断、机器学习和可视化随机图和图群体,提供了灵活易用的算法,可用于理解和分析具有符合 scikit-learn API 的图形,目前已在 Python Package Inde - 模型选择技术概述
本文综述了模型选择领域的各种方法,包括统计,信息论和信号处理等方面的研究。讨论了模型选择的意义、表现和适用性,并提供了一些关于实践中的争议观点。
- 受限制的 f-GANs 的归纳偏差
本文对生成对抗网络(GAN)进行了分析,特别是统计推理这一过程的理论特征,提出了一种简单形式的 GAN,称为受限 f-GANs,发现线性 KL-GANs 的最优生成器所推断出的分布是最大似然与矩法解的有趣组合。