在具有概率集合的多标签问题中进行怀疑二元推断
本文提出了一种建立在鲁棒性预测推断上的不确定性估计模型,使用 conformal inference 方法建立了准确覆盖测试数据分布的预测集,通过估计数据漂移量建立了鲁棒性,并在多个基准数据集上进行了实验证明了该方法的重要性。
Aug, 2020
本文介绍了一种基于黑盒预测器实现集值预测、控制用户指定水平下的未来测试点期望损失大小以及使用 holdout 集来校准优化预测集大小的方法,这种方法能够提供简单、分布自由和严密的误差控制,适用于多个任务,如分类问题、多标记分类、分类问题中带有层次结构的标签、图像分割和蛋白质结构预测,还有拓展探讨。
Jan, 2021
研究数据无任何分布性假设条件下,针对二分类问题的不确定性量化中的三种方法 —— 标定、置信区间和预测集,建立了连接这三个概念的三角脚架,明确了使用基于评分函数的分类器才能进行无分布标定的必要条件。我们还推导了面向固定宽度和统一质量分组的二分类问题中的无分布概率分组方法的置信区间,这些区间可以导致无分布标定。此外,我们还推导了针对流数据和协变量转移的扩展。
Jun, 2020
通过在类概率上使用狄利克雷分布对主观逻辑进行建模并使用确定性神经网络从数据学习收集导致预测的证据的功能,我们提出一种与贝叶斯神经网络正交的方法,该方法可以直接推断出预测的不确定性。我们的方法在检测超出分布的查询和对抗性扰动方面取得了空前的成功。
Jun, 2018
研究了在名义概率分布受到建模误差和异常值影响的情况下的极小极大稳健假设检验问题,并设计了一个基于相对熵距离的稳健假设检验方案,该方案提高了对建模误差的稳健性,并且是之前 Levy 提出的工作的推广。然后,证明了可以通过复合不确定性类将此方案与 Huber 的稳健检验相结合,并证明了鞍值条件的存在。同时,将稳健度量方法扩展到了固定样本量和顺序概率比测试,并将组合模型推广到稳健估计问题。最后,模拟实验验证了所提出的论断。
Feb, 2015
模型得分和不确定性对决策边界的选择有关,该研究提供了理论分析和经验证据来证明模型得分估计偏差依赖于不确定性和得分本身,通过动态规划和保序回归算法提出的方案在三个真实数据集上比传统的只使用模型得分方法,在高精确度边界下获得了 25%-40%的召回率提升,凸显了利用不确定性的好处。
Nov, 2023
在本研究中,我们通过引入基于本地分布鲁棒性的参考分布邻域,提出了一种多任务子模块优化问题的方法。我们首先建议引入一个正则化项,利用相对熵与标准多任务目标之间的关系。然后通过对偶性证明这个新的公式本身等同于最大化一个子模块函数,这可以通过标准的贪婪选择方法高效实现。这种方法填补了多任务子集选择中性能 - 鲁棒性权衡优化的现有差距。为了数值验证我们的理论结果,我们在两种不同的情况下进行了测试,一种涉及对地球低轨道星座中的卫星进行选择以解决传感器选择问题,另一种涉及使用神经网络进行图像摘要任务。我们将我们的方法与两种其他算法进行了比较,这两种算法侧重于最坏情况下任务的性能优化和直接优化参考分布本身的性能。我们得出结论,我们的新公式提供了一种局部分布鲁棒且计算费用低廉的解决方案。
Apr, 2024
该论文介绍了一个重新采样框架,用于构建精确、无分布偏差且非渐近保证的真实回归函数置信区间,以适应用户选择的信赖水平,并提出了具体算法以演示该框架。通过数值实验验证了算法,并将其与近似渐近保证的置信椭球进行比较。
Aug, 2023
在存在噪音标签的情况下,我们研究了在线分类问题。通过一般的核来建模噪音机制,为任何特征 - 标签对指定了一个(已知)噪音标签分布集合。每个时间步骤,对手根据实际的特征 - 标签对从核指定的分布集合中选择一个未知分布,并根据所选分布生成噪音标签。学习者根据迄今为止观察到的实际特征和噪音标签进行预测,如果预测与真实情况不同,则遭受损失 1(否则为 0)。预测质量通过计算有限时间视野 T 上的极小化风险来量化。我们证明了对于广泛的自然噪音核、对手选择的特征和有限类别的标记函数,极小化风险可以上界独立于时间视野并以标记函数类别尺寸的对数形式增长。然后,我们通过随机顺序覆盖的概念将这些结果推广到无限类别和随机生成的特征。我们的结果通过对在线条件分布估计的新颖归约提供了直观理解,并且扩展并包含了 Ben-David 等人(2009)的研究结果,具有显著的广泛性。
Sep, 2023