- 集装箱预抵达时间不确定性下最小化 CV@R 的预装箱问题
梳理货箱布局中遇到的船只到达时间不确定性的问题,提出一种基于条件风险最小化的混合整数线性优化模型并设计一种基于切割平面方法的精确算法,通过数值实验表明该方法与传统稳健优化模型相比可以产生高质量的货箱布局并加速计算大规模问题的求解。
- 通过条件风险值测试进行多组公平性评估
通过允许模型在性能近乎相等的群体上产生微小概率差距的方法,基于条件风险价值 (CVaR) 提出了一种检测性能差异的方法;同时证明了具有特定先验分布权重的情况下,Rényi 熵阶数为 2/3 的先验分布可以捕获所提出的 CVaR 测试算法的样 - 马尔可夫成本过程中的 VaR 和 CVaR 估计:下界和上界
估算 Markov 成本过程中的风险价值和条件风险价值的无穷时段折扣成本的误差的上下界,并讨论了覆盖更一般风险度量的估计方案扩展。
- 分布时变在线随机优化在条件风险价值统计学习中的应用
在本文中,我们通过在线优化的视角,考虑了一个遵循随时间变化的分布的随机优化问题序列。假设损失函数满足 Polyak-Lojasiewicz 条件,我们应用在线随机梯度下降并建立了其动态遗憾界,其中包含由随机性引起的累积分布漂移和累积梯度偏差 - 一种基于模型的方法,用于最小化 CVaR 及更多
我们提出了一种随机近端线性方法的变体,用于最小化条件风险价值(CVaR)目标,该方法在机器学习中的风险测量中具有广泛应用。我们将一般的收敛定理应用于该模型,并通过实验证明,它比随机次梯度方法更好地利用了目标的结构,并且适应了损失函数的缩放, - 风险感知的分布式多智能体强化学习
研究了在未知环境下的决策问题,使用分布式多智能体强化学习和条件风险价值的方法进行决策,并通过模拟评估验证了该方法。
- 引导农民识别最佳作物管理的高效风险意识策略
本项研究旨在探讨如何在不增加农民损失的前提下,寻找最佳农业肥料管理策略。利用一种名为 “赌博算法” 的模型,通过风险感知的度量标准和新颖的农学指标来比较农业肥料的效果,提高农户抵抗风险的能力。
- 通过限制条件风险价值实现安全的强化学习
本文介绍了一种新的增强学习算法 - CVaR-Proximal-Policy-Optimization (CPPO),该算法利用条件风险价值 (CVaR) 进行评估,同时保持其 CVaR 在给定阈值以下,实现了在连续控制任务中对观测和转移扰 - 关于 Wasserstein 球上数据驱动条件约束规划的逼近
研究了三种分布鲁棒的机会限制规划的近似方案,并且在数据驱动的环境下表现得差别很大。其中一种方案采用条件风险价值的紧凑凸估计,并提供了一种新颖的解释方式。同时,他们的优劣无法相互比较。
- 基于风险的随机最短路径
本研究针对马尔科夫决策过程中随机最短路径问题提出了一种基于条件风险价值优化的风险感知控制方法,并通过线性规划和价值迭代两种算法实现了精确而可靠的解决方案。实验结果表明该方法在多个中等规模的问题实例上是可行的。
- 非凸分布鲁棒优化:非渐近分析
本研究探讨分布式鲁棒优化,提出了一种适用于一般光滑非凸损失的 DRO 算法,并将其与条件风险价值(CVaR)设置相结合,得到类似的收敛保证,经实验证明所提出算法的性能表现突出。
- 机器学习中的倾斜损失:理论和应用
本文研究借助指数调控风险函数的方式进行模型优化的问题,提出了倾斜经验风险最小化(TERM)框架及其优化方法,该方法可以灵活地调节损失的影响,减小异常值的影响或增加其公平性,同时具有降低方差和处理不均衡数据的能力,与 Value-at-Ris - 上下文臂带中的离线风险评估
该论文提出了一种基于 Lipschitz 风险函数的离线策略评估框架,使用 OPRA 估算目标策略的 CDF,提供了对任何 Lipschitz 风险集合的插值估计,具有同时保证整个类的有限样本保证,并使用重要性采样和双重稳健估计实例化 OP - 基于尾风险度量的最优臂识别方法
本论文提出了一种基于多臂赌博机算法的方法,用于识别在金融行业和不确定环境中具有最小条件风险价值、价值风险价值或条件风险价值加权平均的多臂赌博机,其主要贡献是一种能够适用于包括重尾分布在内的一般分布上的最优算法,匹配了样本所需的预期数量下界, - 条件风险下的统计学习
研究一种基于条件风险价值(CVaR)的风险规避统计学习框架,提出了基于随机梯度下降的算法。对于凸和 Lipschitz 的损失函数,该算法收敛到最优 CVaR,而对于非凸和平滑的损失函数,该算法在 CVaR 上的泛化界表现良好。通过在各种机 - 最坏情况策略梯度
该研究提出了一种基于 Actor-Critic 框架和条件风险价值的深度强化学习方法,应用于驾驶模拟中,实现了在保证安全的前提下尽量提高任务完成效率,并且相比于其他深度强化学习方法,该方法更具有泛化性。
- 随机风险厌恶学习的自适应采样
在机器学习应用中,我们提出了一种风险规避的训练模型的方法,它通过优化在最难的样本上的表现来提高模型的稳定性和可预测性,关键是利用分布式随机优化算法和结构化行列式点过程进行大规模的学习任务。
- 使用 CVaR 改进变分量子优化
研究混合量子 / 经典变分算法,使用条件风险价值作为聚合函数改善在所有组合优化问题的表现。
- CVaR 估计的浓度界:轻尾分布与重尾分布的情形
该研究使用经验分布和截断法估算 CVaR,得出其轻尾和重尾分布的集中界,并将其应用于多臂老虎机问题中,提出了基于 CVaR 的连续拒绝算法,并利用 CVaR 集中结果导出了算法错误识别概率的上界。
- 经验条件风险价值的集中度界限:无界情形
本文提出了一种基于样本计算条件风险价值 (CVaR) 的方法,通过统计方法得到了一个新的置信边界来估计 CVaR。该方法和得到的置信边界是基于量化反应的风险价值 (VaR) 估计的经验。