无过多实证风险的领域泛化

Aug, 2023

Domain Generalization without Excess Empirical Risk

Ozan Sener, Vladlen Koltun

TL;DR通过最小化约束条件下的惩罚，而不是与经验风险同时最小化，我们提出了一种解决域泛化领域中过度风险的方法，并通过将我们的方法应用于文献中的三种方法来证明其有效性。

Abstract

Given data from diverse sets of distinct distributions, domain generalization aims to learn models that generalize to unseen distributions. A common approach is designing a data-driven surrogate penalty to captur

domain generalization surrogate penalty empirical risk optimization problem rate-distortion theory

发现论文，激发创造

领域泛化中模型验证的原则方法

本研究旨在解决域泛化问题，提出了一种新的模型选择方法，该方法综合考虑分类风险和域差异。通过实验结果验证了该方法的有效性。

Apr, 2023

针对领域特定风险的最小化以实现超出分布的泛化

本文提出了基于领域特定风险最小化（DRM）的方法，旨在通过利用源域信息和适应性差的估计和最小化来弥合领域间差异以实现领域通用性，并在不同分布漂移设置下显着优于竞争基准。

Aug, 2022

通过分布匹配进行到未见过的领域的泛化

本文探讨监督学习中数据导致的实际问题，着重于领域泛化研究，提出最小化给定领域对之间差异的方法，并在 EEG 数据集中验证了该策略。

Nov, 2019

基于模型的领域通用化

本篇论文提出了一种基于模型的域泛化方法，通过对数据生成过程和同变性条件的建模，将域泛化问题转化为一个无限维的有约束统计学习问题，并利用非凸对偶理论发展了有约束松弛的统计问题，提出了具有收敛保证的域泛化算法，并在 ColoredMNIST，Camelyon17-WILDS，FMoW-WILDS 和 PACS 等基准测试中取得了高达 30 个百分点的改进。

Feb, 2021

寻找失落的领域泛化

本文介绍一种在不同训练集下预测性能好的算法 ——domain generalization algorithms，并提出它们在实际应用中的可用性。作者实现了一个名为 DomainBed 的测试平台，测试了不同数据集、不同基准算法和不同模型选择的效果，并发现在经验风险最小化的情况下，预测性能最优。研究人员们的贡献，加上这个领域的开源，将推动可重复性和严格性研究的发展。

Jul, 2020

域通用中未被观察到的混淆因素计算

本文探讨了如何从多个数据集和关于基础数据生成模型的定性假设组合中学习出强健、通用的预测模型。通过定义不同的不变性特性，我们的方法旨在在未观察到混淆因素的情况下建立因果性的解，从而连接数据分布的一组仿射组合上的显式分布鲁棒优化问题。我们在医疗保健数据上展示了我们方法的实证表现。

Jul, 2020

临床环境中领域泛化的经验框架

本研究基于多中心临床时间序列和医学影像数据，评估了 8 种领域泛化方法在现实世界医学成像数据上的性能，并对真实性产生的领域偏差和采样偏差而进行模拟压力测试，发现当前领域泛化方法在现实世界医学成像数据上的表现并不总是能够显著提升。然而，在临床时间序列数据的某些真实性突出情景下，这些领域泛化方法确实会呈现出一定的性能提升，建议在临床环境中采用最佳实践方法来进行领域泛化。

Mar, 2021

领域无关条件不变预测

通过基于判别风险最小化理论和算法的不变特征捕获来解决领域泛化中没有领域标签的挑战，通过测试真实数据集验证了该方法的有效性。

Jun, 2024

不精确学习的领域泛化

不确定域泛化是一个具有挑战性的问题，我们提出了模糊域泛化框架，通过不确定风险优化和模型框架的结合来解决此问题，并展示了将不确定性集成到域泛化中所带来的好处。

Apr, 2024

领域通用化中插值与外推的在线学习方法

本文在一个由风险最小化玩家和出题人提供新测试分布的在线游戏框架下，研究亚群体间的泛化。通过对子组概率似然性重赋权重的基础上，证明外推比内插计算复杂度高得多，而它们的统计复杂度没有明显差异。此外，我们表明 ERM 和含有噪声的变种对于两种任务都是 provably minimax-optimal 的，这为领域泛化算法的形式分析提供了一个新的途径。

Feb, 2021