多用户环境中的符合性预测评估
为了评估机器学习模型单个预测的可信度,我们建立和测试了多视角和单视角的异构传感器融合的模型,这些模型基于相合预测框架,提供了理论上的边际置信保证。通过全面实验,我们证明了多视角模型不仅在准确性性能度量方面(已在多个之前的工作中显示),而且在提供不确定性估计的相合度量方面,比单视角模型表现更好。
Feb, 2024
过去几十年,数据分析和机器学习领域的大部分工作都致力于优化预测模型,并取得比现有模型更好的结果。然而,本文指出对于很多应用而言,更加重要的并非准确的预测,而是变异性或不确定性。本文进一步探讨了让每个人了解不确定性、意识到其重要性并学会拥抱而不是害怕不确定性的世界,对一种确定性估计准确性的具体框架 —— 被称为 “符合性预测” 的框架进行了细致研究。而且,无需对数据进行参数假设,这一非参数结果在渐近程度上也不必依赖大数定律,使得这个框架成为唯一值得称为 “无分布假设” 的框架。
May, 2024
本文研究机器翻译的不确定性评估方法,发现目前大多数方法对模型不确定性的估计较低,建议采用分布自由的合规预测法来保证覆盖度,并提出条件合规预测技术来获得每个数据子组的校准子集,从而实现覆盖率均衡。
Jun, 2023
在这项研究中,我们通过进行一项预先注册的随机对照试验,提供给人类被试一些确定度集合,从而研究了确定度集合对人类决策的辅助作用。结果表明,使用确定度集合来量化模型的不确定性对于人机合作决策和人工智能团队非常有帮助。
Jan, 2024
本文提出一种新的针对预测模型的 Conformal prediction 泛化方法,通过引入加权分位数来抵御数据分布漂移的影响,同时设计一种新的随机化技术,允许不对称处理数据点的算法。实验表明,该方法在数据点不可交换的情况下具有较高的鲁棒性,并且在数据点可交换情况下达到了与现有方法相同的覆盖率保证。
Feb, 2022
该研究提出将自适应拟合框架结合到联邦学习中,确保预测集的分布自由且提供覆盖担保,可在不需要对模型进行任何其他修改的情况下获得不确定性估计,实验证明本方法在医学影像分类任务中取得了更佳的覆盖度。
Oct, 2021
介绍一种无需分布假设或模型假设,可用于任何预训练模型(如神经网络)生成 100% 正确性置信区间(信赖区间)的方法, 称之为一致预测;并提供了 Python 示例代码和 Jupyter 笔记本来说明此方法在计算机视觉、自然语言处理和深度强化学习等领域上的应用。
Jul, 2021
机器学习系统中风险量化与控制的研究,集中在处理 ML 系统收集自身数据时产生的数据分布变化问题,通过扩展 conformal prediction 理论以适应任意数据分布,并提出了针对特定数据分布的可行算法,以解决这一挑战。
May, 2024
快速增长的大型语言模型和自然语言处理(NLP)应用对不确定性量化提出了关键需求,以减轻幻象等风险并提高关键应用中的决策可靠性。条件预测正在成为一个理论上健全且实用的框架,结合了灵活性和强有力的统计保证。它的模型无关性和无分布性质使其特别有希望解决源于 NLP 系统缺乏不确定性量化的现有缺点。本文对条件预测技术、其保证以及 NLP 中的现有应用进行了全面调研,指出了未来研究的方向和面临的挑战。
May, 2024