迈向人工智能与人类互补性的预测集
在这项研究中,我们通过进行一项预先注册的随机对照试验,提供给人类被试一些确定度集合,从而研究了确定度集合对人类决策的辅助作用。结果表明,使用确定度集合来量化模型的不确定性对于人机合作决策和人工智能团队非常有帮助。
Jan, 2024
在高风险领域中部署深度神经网络时,由于缺乏可解释性,不确定性量化变得具有挑战性。本文通过大规模预注册实验,比较了使用符合性预测集合与 Top-1 和 Top-k 预测展示相比在 AI 辅助图像标注中表现的优势,并发现对易任务来说,预测集合与 Top-1 和 Top-k 展示的准确性相当或略少,但在标记超出分布范围的图像时,特别是当集合大小较小时,预测集合能够卓越地帮助人类进行标注。研究结果从实证角度指出符合性预测集合的实际挑战,并提供了将其纳入实际决策制定的启示。
Jan, 2024
本文研究了如何在人与 AI 的合作中使用置信预测(conformal prediction)方法,发现使用置信预测可以提高团队绩效,引入 D-CP 方法则可以降低置信预测中的不确定性。
May, 2022
本文提出了一种新型决策支持系统,通过嵌套结构的预测集和专家的设想单调性假设,实现比普通 bandit 算法更好的结果;大规模人类学科研究 ($n=2751$) 表明,这种限制专家代理水平的决策支持系统实用且可能提供比允许专家始终行使其代理权的系统更好的性能。
Jun, 2023
在安全关键的分类任务中,我们提出了一种适用于含有模糊标签的情况的 conformal prediction 框架,在 approximated 的标签的基础上通过近似输入的后验分布来进行不确定性的校准。我们在合成和真实数据集上验证了我们的方法,并在皮肤病学中患者条件分类的案例研究中进行了实证。
Jul, 2023
通过理论和实验,本文证明了无视概率值可以减轻在 conformal prediction 中概率值失配所导致的大预测集的不良影响。然后,提出了一种名为 “Sorted Adaptive prediction sets” (SAPS) 的新算法,其丢弃除最大 softmax 概率以外的所有概率值,以最小化非符合度分数对概率值的依赖,同时保留不确定性信息,从而生成小型集合并传达逐个实例的不确定性。在理论上,提供了 SAPS 的有限样本覆盖保证,并证明了 SAPS 的预期集合大小始终小于 APS。广泛的实验验证了 SAPS 不仅减小了预测集,还显著提高了预测集的条件覆盖率和适应性。
Oct, 2023
本文提出了一种称为聚类置信预测的方法,该方法通过聚类类,将具有 “相似” 信心得分的类聚合在一起,然后在聚类水平上执行置信预测,进行分类问题中的更强的置信度验证,应用于多分类图像数据集中表现更加优秀。
Jun, 2023
通过建立基础预测器的泛化性能与条件概率预测集成信息量之间的理论连接,本研究推导了一个上界,以便理解条件概率预测集的平均大小对校准数据量、目标可靠性和基础预测器的泛化性能的依赖关系。通过简单的数值回归和分类任务验证了理论洞察的有效性。
Jan, 2024
本文提出了基于条件概率密度 p (x|y) 而非 p (y|x) 的符合性预测集合(conformal prediction sets)来消除分类模型中的傲慢偏差(hubristic bias),该模型在不确定时会输出空集,能很好地应对对抗攻击(adversarial attacks)。在 ImageNet ILSVRC 数据集和 CelebA、IMDB-Wiki 人脸数据集上以高维卷积神经网络为特征进行的实验结果表明它的性能优秀。
May, 2018