- 网络校准的置信度和确定性的多类别对齐
我们提出了一种基于多类对齐预测均值置信度和预测确定度(MACC)的新的训练时校准方法,通过鼓励模型在预 softmax 分布中提供低(或高)扩散,从而达到了领域内和领域外预测的最先进校准性能。
- DOMINO++:面向领域感知的深度学习泛化能力的损失规范化
本文介绍了 DOMINO++,这是一种面向 OOD 泛化能力的双引导和动态领域感知损失正则化方法,它整合了专家引导和数据引导的知识,通过对合成噪声、旋转数据以及不同磁共振成像扫描仪的真实数据进行综合评估,证明了 DOMINO++ 在真实临床 - 深度学习中的校正:现有技术综述
深度神经模型校准在构建可靠的安全关键应用的人工智能系统中起着重要作用。本文回顾了最新的校准方法,并对它们进行了原理解析。
- 自适应标签扰动下的密集分类模型校准
提出自适应随机标签扰动 (ASLP) 方法,通过学习每个训练图像的独特标签扰动水平,使用自校准二值交叉熵(SC-BCE)损失统一标签扰动过程,最大化预测熵,并通过最小化预测准确度和目标训练标签的预期置信度之间的差距来改善模型校准度。实验结果 - 一种基于贝叶斯编程的有限数据下的车辆跟随模型校准和验证方法
使用贝叶斯方法进行数据分析和参数估计,评估交通仿真软件中基于遗传算法的校准过程,研究车辆跟驰模型在模型校准中的层次化建模优势,并应用概率建模对车辆跟驰模型进行验证。
- 深度学习中的一致置信现象及其对校准的影响
本文研究了深度神经网络模型校准方面的现有问题,并发现这类模型存在大量 “几乎确定” 置信度,导致常常过于自信。同时,文章提出可采用 Mixup 数据增强技术中的修改损失函数的方法来解决此类问题。
- 基于变压器模型的社交媒体压力和抑郁识别校准
使用 BERT 和 MentalBERT 模型,将额外的语言信息注入到社交媒体上进行的压力和抑郁症检测中,通过 Multimodal Adaptation Gate 此方法在三个公开数据集上的表现有所提高。标签平滑化可以提高模型性能和调整模 - 基于上下文感知注意力层与最优传输域自适应方法的自发言语痴呆识别
本研究提出了一种新的方法,通过多模态交互捕获 AD 困扰患者的主要特征,使用 BERT 和 DeiT 等模型搭建语言和声音领域的自注意力模型,采用优化的传输域自适应方法,在标签平滑 calibration 方法的指导下,表现出相对较高的准确 - 从损失函数中分离分位数表示
本文中,我们介绍了一种同时二元分位数回归(SBQR)的技术,可以独立于损失函数构建分位表示,对于检测越界样本和校准模型等问题具有优越性。
- 从头到尾传递知识:长尾分布下的不确定性校准
本论文研究如何从长尾分布的样本中训练模型并校准,利用知识转移和重要性权重估算方法,将尾部类别的目标概率密度适应地从头部类别中传输,实现了长尾分布校准,并在多个数据集上证实了该方法的有效性。
- Dice Semimetric Losses: 用软标签优化 Dice Score
本文介绍了 Dice 半度量损失(DMLs),该方法与标准设置下的软 Dice Loss(SDL)相同,在软标签设置下更优。实验结果表明,使用 DMLs 与软标签相结合可获得更好的分割结果以及模型校准,有助于其在实践中的广泛应用。
- IKD+: 可靠的低复杂度深度模型用于视网膜病变分类
本文提出了一种迭代知识蒸馏 (IKD+) 方法,它平衡了模型大小、预测准确性和可靠性,并使用两种常用的模型校准技术对其进行了验证,结果表明在保持准确性的同时,IKD + 方法的模型参数量可以减少近 500 倍。在可靠性方面,IKD + 方法 - 多头多损失模型校准
提高机器学习模型的预测准确性和可靠性,本文提出了一种简化深度集成模型的方法,通过不同的误差计算方法来训练多个线性分类器,达到与成本高昂的深度集成模型相同的校准能力和良好的分类性能,适用于组织病理图像和内镜图像的分类应用。
- DOMINO: 领域感知损失用于深度学习校准
本文提出一种新颖的基于领域感知的损失函数,通过对目标领域内类别相似度的惩罚来提高深度学习模型的校准度,确保模型即使在错误时也能够减少风险错误,从而改善医学影像任务的性能。
- EMNLP硬门知识蒸馏 —— 利用校准实现强韧可靠的语言模型
在知识蒸馏中,我们探索了一个很少被关注的问题:什么时候蒸馏知识?我们提出了模型校准的概念,将教师模型视为不仅提供知识的源头,而且作为检测学生模型失调的一个标尺。这种新颖的观点导致了一个硬门控知识蒸馏方案,可以在教师模型和训练数据之间进行学习 - 利用人类判断的歧义图像进行强化视觉事件分类
本文提出了一种制作模糊图像数据集的方法,并使用此数据集评估现有视觉事件分类模型。实验结果表明,现有的视觉模型无法针对模糊图像提供有意义的输出,因此需要更多类似模糊图像数据集的创造和模型的研究。
- 学习形态学特征扰动以进行校准半监督分割
本研究提出了一种新颖的一致性驱动半监督分割框架,其通过对编码器和双头解码器进行训练来实现对预测结果的不变性,比传统的半监督方法在 CT 肺血管分割和 MRI 脑肿瘤分割任务上表现更好,并且表明了 MisMatch 相对于其监督学习对应物的更 - ACL使用边缘下面积和显著性指导混合训练对预训练语言模型进行校准
本文研究了 mixup 训练在自然语言理解(NLU)任务的作用,提出了一种用于预训练语言模型的 mixup 策略,并与模型 miscalibration 修正技术相结合来提高模型校准的方法,实验结果表明该方法在低预期的校准误差方面具有竞争优 - EMNLP如何检测不同类型的离群文本
本文提供了关于 Out-of-distribution 检测方法的研究,发现在检测背景变化的数据方面,密度估计表现更好,而在语义变化的数据方面则模型校准表现更好。同时指出当前方法在挑战数据检测方面存在缺陷,需要对 OOD 进行明确的定义。
- ICML长尾视觉识别的类分布感知校准
本文提出了一种考虑类别分布的深度神经网络模型校准方法,针对高频类别过于自信的问题,通过使用类别频率信息来替换温度值或平滑标签,并结合蒸馏损失减少误校准。实验证明该方法在长尾数据集上提高了预测准确性和校准性能。