我们研究了在数据集偏移下的类别分布估计问题,讨论了协变量转移、可因子化联合转移和稀疏联合转移的假设及其对类别分布估计的影响。
Nov, 2023
通过考虑协变量变化,提出了一种对于未知数据能够保持公正与性能的预测模型的方法。
Oct, 2020
我们提出了一种新的非参数方法来进行协变量转移适应,避免了权重估计和超参数调整,并实现了样本规模几乎线性的运行时间,同时保持了与参数方法相同的收敛速度。
Dec, 2023
本文提出拓展 Conformal Prediction 方法,可计算在测试和训练协变量分布不同的情况下的无分布预测区间,同时在数据满足一定加权交换性的情况下,拓展还可以应用于其他设置,如潜在变量和缺失数据问题。
Apr, 2019
统一分析了具有协变量转移的一般非参数方法在再生核希尔伯特空间下的理论,得出了收敛速度,并与现有文献中使用的最优结果相吻合。在合成和实际例子上进行的广泛数值研究证实了我们的理论发现,进一步说明了我们提出的方法的有效性。
Oct, 2023
基于观测数据的领域自适应问题,通过线性结构因果模型和表示学习方法,研究使用不变的协变量表示来解决概念漂移和改善目标预测的可行性,并通过在 Stiefel 流形上约束优化来证明大多数局部最优解与不变的线性子空间一致。通过验证实现方法和理论的三个真实数据集。
Jun, 2024
训练模型以适应由类先验或群组先验的分布变化引起的偏移问题并不容易,我们提出一种极其轻量级的事后方法,通过在验证集上求解约束优化问题并应用于模型,从而在测试时尽量减小选定目标分布周围的分布鲁棒性损失,并带有可证明的保证和实证的结果证明,表明我们的方法非常适用于分布鲁棒的事后分类器。
Sep, 2023
本文探讨了领域自适应问题,证明了只要在一些条件下,任何 PAC 可学习的概念类都可以在协变量转移条件下进行 PAC 学习,同时提出了拒绝取样算法的界限并证明其是某些情况下领域自适应问题的解决方案。
Dec, 2018
本文研究了机器学习中的一个重要研究主题:协变量转移。我们表明这个领域的方法都可以归为信息几何的范畴,并且我们提出的方法可以更高效地进行参数搜索和更好地适应数据,结果比现有方法好。
Apr, 2023
该研究提出了一种用于半监督学习在数据集分布改变的情景下的新方法,基于信息理论,该方法包括了当前流行的熵最小化和伪标签方法,提出了一些新的上界描述其泛化误差情况,其在数据集分布改变的情景下胜过之前提出的方法。
Feb, 2022