本研究旨在解决域泛化问题,提出了一种新的模型选择方法,该方法综合考虑分类风险和域差异。通过实验结果验证了该方法的有效性。
Apr, 2023
本文提出了基于领域特定风险最小化(DRM)的方法,旨在通过利用源域信息和适应性差的估计和最小化来弥合领域间差异以实现领域通用性,并在不同分布漂移设置下显着优于竞争基准。
Aug, 2022
本文探讨监督学习中数据导致的实际问题,着重于领域泛化研究,提出最小化给定领域对之间差异的方法,并在 EEG 数据集中验证了该策略。
Nov, 2019
本篇论文提出了一种基于模型的域泛化方法,通过对数据生成过程和同变性条件的建模,将域泛化问题转化为一个无限维的有约束统计学习问题,并利用非凸对偶理论发展了有约束松弛的统计问题,提出了具有收敛保证的域泛化算法,并在 ColoredMNIST,Camelyon17-WILDS,FMoW-WILDS 和 PACS 等基准测试中取得了高达 30 个百分点的改进。
Feb, 2021
本文介绍一种在不同训练集下预测性能好的算法 ——domain generalization algorithms,并提出它们在实际应用中的可用性。作者实现了一个名为 DomainBed 的测试平台,测试了不同数据集、不同基准算法和不同模型选择的效果,并发现在经验风险最小化的情况下,预测性能最优。研究人员们的贡献,加上这个领域的开源,将推动可重复性和严格性研究的发展。
Jul, 2020
本文探讨了如何从多个数据集和关于基础数据生成模型的定性假设组合中学习出强健、通用的预测模型。通过定义不同的不变性特性,我们的方法旨在在未观察到混淆因素的情况下建立因果性的解,从而连接数据分布的一组仿射组合上的显式分布鲁棒优化问题。我们在医疗保健数据上展示了我们方法的实证表现。
本研究基于多中心临床时间序列和医学影像数据,评估了 8 种领域泛化方法在现实世界医学成像数据上的性能,并对真实性产生的领域偏差和采样偏差而进行模拟压力测试,发现当前领域泛化方法在现实世界医学成像数据上的表现并不总是能够显著提升。然而,在临床时间序列数据的某些真实性突出情景下,这些领域泛化方法确实会呈现出一定的性能提升,建议在临床环境中采用最佳实践方法来进行领域泛化。
Mar, 2021
通过基于判别风险最小化理论和算法的不变特征捕获来解决领域泛化中没有领域标签的挑战,通过测试真实数据集验证了该方法的有效性。
Jun, 2024
不确定域泛化是一个具有挑战性的问题,我们提出了模糊域泛化框架,通过不确定风险优化和模型框架的结合来解决此问题,并展示了将不确定性集成到域泛化中所带来的好处。
Apr, 2024
本文在一个由风险最小化玩家和出题人提供新测试分布的在线游戏框架下,研究亚群体间的泛化。通过对子组概率似然性重赋权重的基础上,证明外推比内插计算复杂度高得多,而它们的统计复杂度没有明显差异。此外,我们表明 ERM 和含有噪声的变种对于两种任务都是 provably minimax-optimal 的,这为领域泛化算法的形式分析提供了一个新的途径。