- 学习概念转变时:混淆、不变性和降维
基于观测数据的领域自适应问题,通过线性结构因果模型和表示学习方法,研究使用不变的协变量表示来解决概念漂移和改善目标预测的可行性,并通过在 Stiefel 流形上约束优化来证明大多数局部最优解与不变的线性子空间一致。通过验证实现方法和理论的三 - 迁移学习中最小范规则化插值器的泛化误差
该论文通过对池化的最小 l2 范数插值在转移学习中的广义误差进行建模,研究了模型转换和协变量转换下的偏差和方差。
- KDD基于模型逆向增强的离线模仿学习
提出了一种新的基于模型的框架 —— 离线模仿学习与自适应反向增强(SRA),该框架通过从离线演示构建反向动态模型,以自适应的方式生成导致专家观察到的状态的轨迹,并使用后续的强化学习方法从增强的轨迹中学习,将从专家未观察到的状态转移到专家观察 - 分布鲁棒的安全样本筛选
本研究提出了一种名为分布鲁棒安全样本筛选(DRSSS)的机器学习方法,旨在识别不必要的训练样本,即使训练样本的分布在未来发生变化。通过将分布鲁棒(DR)范式与安全样本筛选(SSS)有效地结合起来,我们实现了此目标。我们通过扩展现有的 SSS - 上下文优化在协变量漂移下的鲁棒方法:通过相交的 Wasserstein 球
在上下文优化中,通过观察不确定变量的历史样本和相关联的并发协变量,不知道它们的联合分布。在给定附加协变量观测情况下,目标是选择最小化某些操作成本的决策。这里的一个普遍问题是协变量偏移,其中新协变量的边际分布与历史样本不同,导致具有非参数或参 - 信息流行病管理中的早期误信息检测:一种领域适应方法
通过理论分析,我们开发了一种新的误信息检测方法,旨在解决 covariate shift 和 concept shift 问题,并通过广泛的实证评估证明了其在与先进的误信息检测方法和主要领域适应方法相比的卓越性能。
- 多 CATE: 对未知协变量转变健壮的多准确条件平均处理效应估计
通过学习多准确性预测器,我们提出了一种方法,用于在部署时解决未知协变量转变,从而改善异质处理效应预测,并在因果推断和机器学习中取得了令人满意的结果。
- 应对运行隐写分析中的协变量偏移的盲数据适应
社交网络中图像操作的滥用带来了重大挑战。尤其令人担忧的方法是图像隐写术,使个人能够在数字图像中隐藏非法信息而不引起怀疑。本文致力于解决隐写分析模型在真实世界数据集上的实用性问题,通过几何对齐和源目标残差的分布匹配,构建了一种名为 TADA( - 分布鲁棒安全筛选
我们提出了一种名为分布鲁棒安全筛选(DRSS)的方法,用于在 DR 协变量转变设置中识别不必要的样本和特征。该方法有效地将 DR 学习与安全筛选相结合,对模型训练之前的无关样本和特征进行了稀疏优化,实现了在特定范围内可靠地识别任何未来分布的 - 自主驾驶路径规划的残差链预测
在自动驾驶系统领域,路径规划算法的改进对于车辆在动态环境中尤其是复杂城市场景中的导航至关重要。本研究引入了新概念的 Residual Chain Loss,通过动态调整损失计算过程来增强预测路径点的时间依赖性和准确性,显著提高模型性能,并且 - 优化的岭回归正则化用于外推预测
研究了最优岭回归正则化和最优岭风险在离群分布预测中的行为,建立了决定协变量和回归变化下最优正则化水平符号的一般条件,并证明了在数据纵横比方面,即使在负正则化水平优化的情况下, 优化风险在离群分布设置中是单调递增的。
- 基于增强现实的模拟数据(ARSim)与多视角一致性的自动驾驶感知网络
为了增强自动驾驶系统的有效性,本文提出了 ARSim,一个全自动、综合和模块化框架,用于通过将 3D 合成对象与真实多视图图像数据相结合,来提高真实世界场景的多样性和覆盖范围。实验结果表明,在各种自动驾驶感知任务上,使用增强数据集训练的网络 - COFT-AD:对少样本异常检测的对比微调
在本研究中,我们提出了一种新的方法来解决少样本异常检测(FSAD)的挑战,该方法包括使用预先训练的模型初始化权重,采用对比性训练来优化少样本领域数据,以及使用正样本对齐和负样本分离等技术来学习适合于异常检测的表示。我们对 3 个受控异常检测 - 空间环境下预测方法的一致验证
空间预测是天气预报、空气污染研究等科学探索的关键。确定在统计或物理方法中信任预测的程度对科学结论的可信度至关重要。本文中我们基于现有的共变量转移方法,根据验证数据提出了一个新方法,并在模拟和真实数据上通过经验证明了其优势。
- 了解后续机器学习解释中的不平等
通过模拟实验和真实数据集的实验,研究调查了来自数据和模型属性的解释差异产生的挑战,包括有限样本量、协变量变化、概念变化、遗漏变量偏差以及敏感属性和适当的函数形式的挑战。研究结果表明,解释差异也取决于数据和模型属性,为解释方法设计提供了建议。
- 无需标签:在协变量漂移下估算部署后模型性能的方法
我们提出了一种鲁棒准确的性能估计方法,用于评估无标签数据上机器学习分类模型的性能,准确量化协变量偏移对模型性能的影响,并在 600 个数据集 - 模型对上进行了评估,结果表明,该方法是估计分类模型在任何评估环境中性能的最佳方法。
- 基于核方法的标签偏移适应中的类别概率匹配
在领域适应中,协变量偏移和标签偏移问题是两个不同而互补的任务。针对标签偏移适应,提出了一种称为类概率匹配的新框架,通过匹配两个类概率函数在一维标签空间上估计类概率比率,与在 $d$ 维特征空间上操作的特征概率匹配方法有根本区别。将核逻辑回归 - 最大似然估计是处理良好指定的协变量转移的唯一所需方法
现代机器学习系统的一个关键挑战是实现越界通用化(OOD generalization)- 广义到与源数据分布不同的目标数据。本文证明了在针对协变量转移的规范设置下,令人惊讶的是,纯使用源数据(无需任何修改)的经典最大似然估计(MLE)达到了 - TEA: 测试时间能量调整
通过引入一种新的能量模型视角,我们提出了一种新的测试时间适应方法(TEA),该方法可以增强模型对目标数据分布的感知能力,提高模型的泛化性能。对多项任务、基准和架构的广泛实验证明了 TEA 相对于现有方法的优越性能,深入分析表明 TEA 能够 - 在协变量和依赖偏移下的公平感知领域泛化
基于领域偏移的普适分类器归纳问题几乎困难且复杂,本文通过引入三种不同的分布偏移(概念偏移、协变量偏移和依赖性偏移),提出了一种新颖的领域泛化方法,能够在不同领域中保持模型的准确性和公平性。实验结果表明,该方法在四个基准数据集上超越了现有的方