- ICLR深度网络的性能太好以至于不可信吗?一个直接估计二元分类贝叶斯误差的方法
本研究提出了一种简单直接的贝叶斯误差估计方法,可用于评估分类器和检测测试集过拟合。我们的方法灵活且无模型和实例需求,甚至适用于弱监督数据。实验结果表明,最近提出的深度网络,如 Vision Transformer 等,已经或即将达到基准数据 - EMNLP简单还是复杂?基于软模板和深度专家混合模型的可控制复杂度问题生成
本文提出了一种混合专家 (MoE) 作为软模板选择器的端到端神经复杂度可控问句生成模型,该模型引入一种新颖的跨域复杂度估计器来评估问题的复杂性,实验结果表明我们的模型优于同类方法,并且我们的复杂度估计器在领域内外的情况下比基线方法更准确。
- 熵估计的最优传输映射
本文提出一种可有效计算高维数据分布之间优化映射的估计器,使用 Sinkhorn 算法计算最优熵方案的重心投影,兼具计算效率高和统计性能较好的优势。
- Wasserstein 空间中失真 - 感知权衡的理论
本文研究估计器的感知 - 失真权衡问题,导出了均方误差失真和 Wasserstein-2 感知指数下的失真 - 感知(DP) 函数的闭式表达式,证明了不论潜在分布如何,DP 函数总是二次的。我们还表明,这些估计器可以从感知质量卓越的 MSE - ICML利用全变差正则化从仅有噪声标签中学习噪声转移矩阵
本文提出了一种基于总变差正则化的弱监督分类方法,不需要依赖于易错的含噪类后验预测,可以同时估计噪声转移矩阵和学习分类器。实验证明该方法在基准和实际数据集上的有效性。
- ICML使用 Shapley 值进行人口特征重要性的高效非参数统计推断
本文提出了一种基于 Shapley 种群变量重要性度量 (SPVIM) 的变量重要性估计器,通过仅对指定数量的特征子集进行随机采样来减少计算复杂度,并证明了其在渐进意义下收敛的最佳速率,可以建立有效的置信区间和假设检验。在模拟实验和真实数据 - 神经网络结构搜索的快速性能估计
提出了一种基于训练速度测量的、无模型、高效、便宜的模型估计器,可在各种神经结构搜索空间中提高准确性并改善搜索速度或质量。
- ICML一种规避所有噪声级别的通用降噪算法训练方法
本文从极小极大风险优化的角度解决了在教授像图像降噪这样的任务时,如何分配训练样本中的噪声程度,推导了确定最佳样本分布的双重上升算法,并讨论了如何在实践中实现该算法,验证了算法在线性估计器和深度神经网络上的有效性。
- 防篡改机器学习
本研究提出了一种新的稳健性估计器,以避免在透明决策规则下个体的行为可能造成的操纵行为对决策结果的影响并在肯尼亚的一项大型实验中表明,在策略鲁棒方法估计的决策规则的指导下,其表现优于基于标准监督学习方法的规则。
- 批量稳态分布估计
提出了一种基于变分幂方法的一致估计器,用于估计马尔可夫链的稳态分布,其不需要进一步访问基础的系统。它不仅统一了许多现有方法,还在众多问题中提供了显着更好的估计,包括:队列,随机微分方程,后处理 MCMC 和试验性评估。
- ICML估计非零假设数目和效应大小
本文研究了估计多重检验背景下的效应大小分布的问题。我们提出了一种简单、高效的估计器,可使用廉价的试验数据,在比识别发现类试验所需采样数量显著少的情况下,估计该分布。该估计器可用于保证未来试验中给定实验设计中将被发现的发现数量,并展示了在 D - AAAI马尔可夫奖励过程中折扣值的循环估计器
研究怎样使用所提出的 Loop estimator 算法优化 Policy iteration 算法中的 Policy evaluation 步骤,实现有效的、具有强大空间和收敛性的单状态 s 值计算,以精确地评估 MDP 中的状态价值。
- 单张图像深度估计训练
使用深度焦点提示为基础,基于点扩散函数卷积层的无监督学习深度估计方法能在多个数据集上优于其他无监督方法和与 KITTI 和 Make3D 数据集中的监督方法效果相当,并且与数据集无关.
- ICCV多任务学习的模型选择弹性深度网络
本文提出一种用于多任务学习的实例动态网络模型选择方法,该方法基于一个精简而准确的主干架构为每个任务的实例提供多个不同配置的层级结构网络模型进行估计,并利用选择器从候选模型池中动态地选择最佳模型。实验结果表明该方法具有出色的性能,并可以在多个 - f - 散度估计的实用和一致性
本文研究了在结构假设条件下用样本估算概率分布之间 f-divergence 的问题,提出了一种易于实现、适用于高维数据且收敛速度更快的估算器,并在合成和真实数据实验中验证了其行为。
- 亚高斯速率下的快速均值估计
提出了一种估计随机向量均值的估计器,时间复杂度为 $O (n^4+n^2d)$,其误差界限符合亚高斯分布。与 Hopkins(2018)介绍的基于二次项和谐级数的多项式时间估计器一样,在具有有限均值和协方差的数据分布方面,效率最高,但运行时 - 利用 Fisher 可分析性估算大型生物数据集的有效维度
通过分析数据点的可分离性,我们测试了一种最近引入的维数估计器,该估计器在多个基准测试和真实生物数据集上具有与最先进的度量相竞争的性能,并允许在内在嵌入假设不成立的情况下估计内在维数。
- 基于随机块模型的超图:统计极限和半定规划方法
该文章探讨了在随机超图模型中用于社区检测的随机块模型问题(k-SBM),研究了正确定位问题并表明其存在阈值现象:在阈值以下不可能以非零概率找回社区,而在阈值之上,有一个估计器几乎可以确定性地找回社区。作者还考虑了一种基于半定松弛技术的精确恢 - 标志性完整随机投影
本文提出了一种新的随机投影估计器,其使用期望和正则化方法从数据中估计余弦相似度,并表明在高相似度下,该估计器比标准 Method of 1-bit random projections 更准确。
- NIPS离散连续混合模型的互信息估计
本文提出了一种新的,适用于离散 - 连续混合情况的相互信息估计器,并通过数值实验证明了该估计器的优越性。