- 利用时空 Tweedie 模型进行 0 膨胀和长尾旅行需求预测的不确定性量化
介绍了一种名为空间 - 时间 Tweedie 图神经网络(STTD)的新方法,该方法应用 Tweedie 分布来参数化旅行需求分布,结合空间和时间嵌入来解决高分辨率 O-D 矩阵中的稀疏性和长尾特征,并有效提高了预测的精度和置信区间的准确性 - 匹配任务误差率置信区间:关键审查和建议
本文介绍了构建置信区间的方法,以评估匹配算法的误差率,并探讨了样本大小、误差率和数据相关性对覆盖率和区间宽度的影响。研究发现,在匹配任务中构建置信区间的最佳实践包括注意数据原型、选择适当的置信水平以及进行模拟和分析。
- 在审计差分隐私机器学习中释放随机化的力量
提出了一种基于 Canaries 的方法,通过扩展差分隐私定义来处理随机数据集,设计随机 Canaries,然后采用 Lifted Differential Privacy 来审计,引入新的置信区间,能够显著提高样本复杂性,这一新方案在合成 - 预测驱动的推论
提出了一种利用机器学习进行预测的统计推断框架,可有效计算均值、分位数、线性和逻辑回归系数的置信区间,适用于蛋白质组学、基因组学等多种领域。
- 利用人工神经网络学习不确定性以改进预测性流程监控
研究了使用贝叶斯神经网络中的可学习不确定性来训练预测过程监控模型,以预测剩余时间和结果,并得出结论认为这种不确定性估计可以区分更精确和不太精确的预测,从而提高了用户对于这种预测系统的信心,在合作和以较小的数据集进行更早的实施方面具有潜在的可 - ICLR带不确定性的机器学习现状
本文探讨如何通过置信区间精确度测量来改善机器学习文章的撰写和审查流程,并通过图像分类研究进行了实证研究和模型验证,同时提供开源的可重复工作流程和建议。
- ICML核基学习中的稀疏逼近方法的改进收敛速率
本文针对核方法的高计算成本问题,提出了 Nyström 方法和稀疏变分高斯过程逼近方法的置信区间,从而改进了模型在回归和优化问题中的性能界限。
- 利用地面探测雷达和高斯过程回归技术绘制埋藏电缆地图
该论文提出了一种基于地下探地雷达和高斯过程回归的新方法找寻埋藏电缆的位置,并提出了基于聚类和高斯过程回归的电缆拟合算法,通过实验验证了该方法的有效性。
- 紧致的 RKHS 元素在线置信区间的开放问题
研究了基于核的赌博机和强化学习问题,利用可再生核希尔伯特空间 (RKHS) 元素的置信区间,发现现有置信区间似乎不紧,导致次优的遗憾度界限,存在几种核化赌博机算法 (例如 GP-UCB,GP-TS 及其变种) 的现有遗憾度界限可能甚至不能达 - EMNLP不确定性感知的机器翻译评估
本研究介绍了一种基于神经网络度量的机器翻译质量不确定性评估方法,并结合蒙特卡罗 dropout 和深度集成等两种不确定度估计方法,得出质量分数以及置信区间。通过对来自 QT21 数据集和 WMT20 度量任务的多语种数据进行实验,验证了该方 - 高斯过程赌博机的最优顺序简单后悔
研究了高斯过程二元组和连续性优化问题之间的联系,建立了稳健分布,使用分步方式获得最终收敛结果并得到了一系列引理。
- 利用 M - 估计器对自适应收集数据进行统计推断
本论文通过理论分析,提出了一种基于 M - 估计量的方法,利用自适应算法(包括习得算法和最大似然算法)处理 bandit 算法采集的数据,进而构建了一种渐进有效的置信区间方法,可用于许多统计推断目标。
- 使用重采样方法进行摘要评估度量的统计分析
本文介绍了利用自主重采样方法来计算置信区间和运行假设检验的方法, 并对几个自动评估度量进行了分析,发现自动评估度量的可靠性存在高度不确定性
- ICLROff-policy Evaluation 的非渐进置信区间:原始和对偶界限
本文提出一种基于原始 - 对偶优化的算法,用于构建非渐进置信区间,该算法利用了 Feng 等人(2019 年)的核贝尔曼损失(KBL)和适用于具有未知混合条件的时间依赖数据的新的鞅集中不等式,明确展示了算法的优势。
- CoinDICE:离线策略下置信区间估计
本研究提出了一种新的算法 CoinDICE,用于估计目标策略的价值的置信区间,有效地解决了强化学习中关于行为无关离线评估的问题。
- 使用赌博方法估计有限随机变量的均值
本文引导出了计算未知均值的置信区间和时间均匀置信序列的一般方法,并应用于研究有界均值、有限抽样和无限抽样等多个问题。
- 测试误差的交叉验证置信区间
研究了交叉验证的中心极限定理和渐近方差一致估计,为 $k$ 折测试错误的可实现渐近精确置信区间和有效的假设测试提供了理论框架,并且在真实数据实验中表现优异。
- 通过自标准化的重要性权重实现自信的离线评估和选择
该研究考虑在上下文匹配机器学习算法的偏离策略评估中,提出了一种新的方法 —— 基于自归一化重要性权重估算目标策略的价值下界,并在合成和实际数据集上测试表明该方法可获得更优越的策略,包括更紧密的置信区间和选择的质量。
- 无分布假设的二分类:预测集,置信区间和校准
研究数据无任何分布性假设条件下,针对二分类问题的不确定性量化中的三种方法 —— 标定、置信区间和预测集,建立了连接这三个概念的三角脚架,明确了使用基于评分函数的分类器才能进行无分布标定的必要条件。我们还推导了面向固定宽度和统一质量分组的二分 - ICML使用 Shapley 值进行人口特征重要性的高效非参数统计推断
本文提出了一种基于 Shapley 种群变量重要性度量 (SPVIM) 的变量重要性估计器,通过仅对指定数量的特征子集进行随机采样来减少计算复杂度,并证明了其在渐进意义下收敛的最佳速率,可以建立有效的置信区间和假设检验。在模拟实验和真实数据