- 早期疾病发生预测中的数据集偏移问题的外部拒绝选项方法
该研究提出了一种名为 Odrop 的方法,结合了 OOD 检测模型,并在健康和医疗数据中应用 OOD 检测,以减少数据集偏移对疾病预测准确性的影响。
- 基于深度学习的立体稠密匹配数据集转移评估
从 LiDAR 和图像直接生成地面实况视差图以产生大量且多样化的数据集,并通过 LiDAR 与图像间的配准细化方法来避免精度损失和处理遮挡,从而实现了在不同数据集中评估 11 种密集匹配方法,其中 GANet 在相同的训练和测试数据上表现最 - 生成对数据集漂移具有鲁棒性的浮游生物分类器
现代浮游生物高通量监测依赖于深度学习分类器对水生态系统中的物种识别。我们研究中集成了 ZooLake 数据集和 10 个独立部署日的手动标注图像,作为用于评估超出数据集的表现的测试单元。我们通过分析发现,在实际场景中,分类器在初始数据集条件 - 在没有标签的标签偏移下估计校准误差
在面对数据集转移时,模型校准在确保机器学习系统可靠性方面起到关键作用。本研究提出了一种基于标签转移的新型 CE 估计器,通过利用加权重要性重新调整标记源数据分布,实现了对转移目标分布的一致且渐进无偏的 CE 估计,实验结果表明该估计器的有效 - 类分布估计的不变性假设
我们研究了在数据集偏移下的类别分布估计问题,讨论了协变量转移、可因子化联合转移和稀疏联合转移的假设及其对类别分布估计的影响。
- 二进制量化和数据集变化:实验调查
在这项研究中,我们通过实验分析了当前的定量化算法在不同类型的数据集偏移下的行为,以识别现有方法的局限性,并为开发更广泛适用的方法铺平道路。我们通过提出细粒度的数据集偏移类型分类,建立受这些偏移类型影响的数据集生成协议,并在生成的数据集上测试 - 马铃薯病害检测的学习特征和框架分析
通过使用区域卷积神经网络(RCNN)和基于注意力机制的网络,从叶片上的病斑或健康区域学习特征的方式,处理了训练数据分布与测试数据分布不一致所带来的分类器性能问题,测试集上的平均分类准确率约为 95%,在训练阶段未见过的数据集上平均得分为 8 - 一种基于 Shapley 值且对回归中概念漂移具有鲁棒性的特征选择方法
本文提出了一种新的特征选择方法,使用 Shapley 值来研究每个变量对预测的影响,以应对数据集漂移和变量关系变化的情况,并通过分析电力市场的例子进行验证。
- 数据集转化诊断的统一框架
介绍了使用统一框架来检测数据移位类型并量化其强度,以便改进预测方法,可用于分类和回归任务。
- 批量策略优化中的模型选择
在上下文 bandit 设置下,通过识别任何模型选择算法应优化折衷的三个错误源(近似误差,统计复杂性和覆盖率),我们研究了批次策略优化中的模型选择问题。尽管无法同时保证所有三个源的保证,但松弛其中任何一个错误源均可实现近似于预测准确性和模型 - KDD分类器调整:变革在发生
提出了无界和有界的调整方法,以平均预测与类分布相等化,以最小化得分规则。实验结果表明在实际应用中,即使类分布仅近似已知,仍然可以根据移位量和类分布的精度减少损失。
- ICML在主动学习中减轻采样偏差并提高鲁棒性
该论文提出了简单而高效的方法来减轻主动学习中的采样偏差,同时实现最先进的精度和模型鲁棒性。通过引入有监督对比主动学习和选择具有多样的特性表示的信息性数据样本的无偏查询策略,我们的方法:SCAL 和 DFM,实验表明,所提出的方法降低了采样偏 - ICMLBaCOUn:具有分布外不确定性的贝叶斯分类器
使用贝叶斯框架在深度分类器上进行推理,从而获得可靠的不确定性估计。将一个生成器与基于边界点的特征组合起来,用于处理训练数据中的偏移问题。
- ICML基于类别相关领域漂移的鲁棒分类
这篇论文探讨了一种特殊的数据集漂移,称为类依赖性领域漂移,提出了使用神经网络解决有信息论约束的优化问题的方法,并在玩具数据集上进行实验,证明了该方法能够学习到健壮分类器并能够推广到未知领域。
- ECCV姿态估计回归的对抗转移
我们提出了一种基于迁移学习和领域自适应技术的深度适应网络,通过自监督学习获取具有场景不变性的图像表示,并将其用于摄像机姿态估计中。在 Cambridge Landmarks 和 7Scene 上的评估表明,该网络优于几个基线,并与最先进的方 - 深度集成:一种损失景观的视角
通过研究深度神经网络的损失函数平面的同构性,我们证明了深度集合优于贝叶斯神经网络在提高准确度和对数据集变化的鲁棒性方面,并发现随机初始化的权重可以探索不同的函数空间而产生更多样的结果。
- 评估数据集偏移下模型预测不确定性的可信度
以大量分类问题为基础,对现有现代机器学习方法中不同的贝叶斯和非贝叶斯概率量化预测不确定性的方法进行了评估,发现一些基于模型边缘化的方法在广泛的任务领域内表现出令人惊讶的强大效果。
- 响亮地失败:检测数据集漂移方法的实证研究
本文探讨机器学习系统在面对各类输入时,如何通过检测数据集漂移并量化其恶性,从而建立高鲁棒性的系统,同时提出使用预训练分类器的双样本测试法在多种数据集漂移情况下表现最佳,且判别方法有助于定性确定数据集漂移的影响。
- 反事实标准化:采用因果机制积极应对数据集变化以及提高可靠性
通过使用因果机制的图形知识,识别具有不稳定的统计影响路径的变量并将其从模型中删除,同时使用潜在反事实变量来隔离不稳定的统计影响路径,可以改进模型的泛化能力和可靠性。
- NIPS使用深度集成实现简单且可扩展的预测不确定性估计
本研究提出了一种替代贝叶斯 NN 的简单实现方法,其能够产生高质量的预测不确定性估计,并在分类和回归数据集上进行了实验以证明这一点。此外,研究还评估了在已知和未知数据分布下的预测不确定性,并证明该方法能够在超出分布的样本上表现出更高的不确定