端到端条件鲁棒优化
基于数据驱动的方法预测后优化决策问题,使用非凸生成模型的情景预测区域构建了 Conformal-Predict-Then-Optimize(CPO)框架,保证了鲁棒性,并通过提供可视化的不确定性区域的语义化摘要,为最优决策提供了定性的直觉。
Oct, 2023
本文介绍了结合预测算法和优化技术来解决不确定性决策问题的上下文优化领域。文中关注单一和两阶段随机规划问题,识别了三种从数据中学习策略的主要框架,并讨论了它们的优点和局限性。
Jun, 2023
本文介绍了使用分布式鲁棒优化 (DRO) 解决交叉事实风险最小化 (CRM) 问题的想法,并证明了 DRO 是对策反决策的一种有原则的工具。我们提出了使用 Kullback-Leibler 马氏距离作为 CRM 中不确定性的代替方法,并基于这一方法提出了一种新的鲁棒对策反目标。通过实验证明,在实践中使用其他不确定性度量具有重要意义。
Jun, 2019
我们研究了一种具有多步非线性切换成本和反馈延迟的挑战性平滑在线凸优化(SOCO)形式,提出了一种新颖的机器学习(ML)增强的在线算法,名为 Robustness-Constrained Learning(RCL),它通过受限投影将不受信任的 ML 预测与可信的专家在线算法结合起来,以增强 ML 预测的鲁棒性。具体而言,我们证明了 RCL 能够对于任何给定的专家保证(1+λ)竞争力,其中 λ>0,同时以鲁棒性感知的方式明确地训练 ML 模型以提高平均性能。重要的是,RCL 是第一个在多步切换成本和反馈延迟情况下具有可证明的鲁棒性保证的 ML 增强算法。我们以电动交通的电池管理为案例研究,展示了 RCL 在鲁棒性和平均性能方面的改进。
Oct, 2023
该论文研究了利用神经网络在 robust combinatorial optimization 中解决 minimax optimization 问题的新方法 Learning for Robust Combinatorial Optimization (LRCO),并通过在车载边缘计算中解决任务分配问题进行模拟,证明了 LRCO 能够大大减少最坏情况的成本和提高鲁棒性,同时具有非常低的运行时复杂度。
Dec, 2021
提出了一种名为 DORO 的分布与离群点鲁棒优化框架,其中核心在于改进的风险函数,可以解决分布变化和离群点的问题,从而提高了机器学习的性能和稳定性。该方法有助于提升现代大型数据集的实验结果。
Jun, 2021
我們對 CoRe 優化器進行了廣泛的性能比較,並與其他九種優化算法進行了比較,包括 Adam 優化器和韌性反向傳播 (RPROP),結果顯示 CoRe 優化器在各種機器學習任務中表現最佳或競爭力非凡,而只需根據小批量或批量學習改變一個超參數。
Jul, 2023
本文扩展了分布鲁棒优化方法,提出了 Counterfactual Risk Minimization 原则的凸重构方法,介绍了通过 DRO 框架构建离线情境强化学习的渐近置信区间,使用了已知的鲁棒估计渐进性结果自动校准置信区间,并呈现了初步实验结果支持我们方法的有效性。
Nov, 2020
该论文主要研究了分布鲁棒优化(Distributionally Robust Optimization,DRO)中的约束问题,针对非凸损失函数提出了一种随机算法并进行了性能分析,证明了该算法能够找到一个满足 ε- 稳定点,而且计算复杂度为 O (ε^(-3k_*-5)),此外,数值结果表明该方法优于现有方法。
Apr, 2024
通过灵活利用数据的几何形态与最小风险优化算法相结合,本研究提出了一种新型的校准方法 —— 几何校准分布鲁棒优化 (Geometry-Calibrated DRO,GCDRO),该方法减轻了噪声样本的影响,理论分析和广泛实验证明了其相较于常规分布鲁棒优化方法的优越性。
Nov, 2023