基于 Wasserstein 分配鲁棒性的上下文强化学习策略评估与学习
研究了采用分布鲁棒优化方法(distributionally robust optimization,DRO)来推断个性化治疗规则(individualized treatment rules,ITRs)的估计器在新设置中的应用,包括 Wasserstein distance-based ambiguity characterizations 和其在目标人群中的理论表现的评估。这个方法在目标人群中优于传统的策略。
May, 2022
本文提出了一种基于新近估算定理的 WDRO(Wasserstein 分布鲁棒优化)最小化器,通过实现该最小化器及提供相应的风险一致性结果,发现该方法成功应用于本地扰动数据的 WDRO 推断,同时对噪声数据如图像分类数据集表现出鲁棒性优异的效果。
Jun, 2020
此论文介绍了基于 Wasserstein 分布鲁棒优化的数据驱动决策方法,能够解决样本有限、参数不确定的情况下,采用仅仅通过数据学习决策的问题,绕过测试样本不能涵盖所有情况的问题,具有良好的效果且容易计算。此方法对于分类、回归等基本学习任务有很好启示作用。
Aug, 2019
我们提出了一种计算效率高的框架,称为 FlowDRO,用于解决基于流的分布鲁棒优化(DRO)问题,该框架利用 Wasserstein 不确定性集,并要求最差情况分布(也称为最不利分布,LFD)连续,从而使该算法能够在具有更大样本量的问题中进行扩展,并为引入的鲁棒算法提供更好的泛化能力。
Oct, 2023
研究了一个基于 Wasserstein 分布的鲁棒控制策略问题,提出了一个可计算的值迭代算法和策略迭代算法,并通过动态规划和 Kantorovich 对偶理论的分析,在保证置信水平不降低的情况下,构造了一个多阶段性能保证和最优分布鲁棒控制策略。
Dec, 2018
本文发展了关于 Wasserstein DRO(分布鲁棒优化问题中的一种方法)变化规则的一般理论,它是一种新形式的正则化,可以处理可能不是凸的和不光滑的损失以及非欧几里得空间上的损失。通过应用我们理论中的变化规则,我们为对抗性鲁棒学习提供了新的泛化保证。
Dec, 2017
本文提出一种基于 Wasserstein 的分布鲁棒性优化方法,旨在通过同时应用本地和全局正则化,将原始分布与最具挑战性的分布相结合,提高模型的建模能力,解决深度神经网络在实际应用中对抗性示例和分布偏移等问题。实验结果表明,该方法在半监督学习、领域适应、领域泛化和对抗机器学习等各领域中均明显优于现有的正则化方法。
Mar, 2022
本文研究了基于 Wasserstein 距离的分布鲁棒优化问题,将其归约为半无限规划问题,并提供了求解非线性模型的交换算法和凸情况下基于分离预言的中心割面算法,通过对分布鲁棒广义 logistic 回归模型的数字实验表明,该算法无论是在预测精度上还是在标准误差方面都表现得更好。
Apr, 2017
本文研究表明多个机器学习评估器,包括平方根 LASSO 和正则化逻辑回归,可以表示为分布鲁棒优化问题的解决方案,其相关的不确定区域基于适当定义的 Wasserstein 距离。因此,我们的表示使我们能够将正则化视为引入人为对手的结果,该对手扰动经验分布以考虑损失估计中的样外效应。此外,我们引入了 RWPI(Robust Wasserstein Profile Inference),这是一种新颖的推断方法,它将启发式似然性方法的使用扩展到最优传输成本的设置中(其中 Wasserstein 距离是一个特殊情况)。我们使用 RWPI 展示如何最优地选择不确定性区域的大小,从而能够选择这些机器学习评估器的正则化参数,而不使用交叉验证。数值实验也给出了验证我们理论发现的结果。
Oct, 2016