- 基于贝叶斯神经网络的随机优化问题学习解决方案
使用贝叶斯神经网络和随机规划技术的预测不确定性建模,以降低决策风险和提高决策质量。
- 大规模随机程序的妥协决策可靠性理论
本文研究了基于 “妥协决策” 过程的随机规划解决方案的可靠性,采用最小化多次复制解决方案的目标函数近似的方法,并利用 Rademacher 平均值限制了 “妥协决策” 的抽样复杂性。
- 针对网络物理系统和机器人系统的随机在线优化
我们提出了一种新颖的基于梯度的在线优化框架,用于解决在网络物理和机器人系统中经常出现的随机规划问题。我们的问题形式化考虑了模拟网络物理系统的约束条件,该系统通常具有连续的状态和动作空间,是非线性的,并且状态只被部分观测到。我们还在学习过程中 - 移动边缘计算中基于学习的应用部署问题的解决方案
本研究利用机器学习模型对边缘服务器中的请求分配进行优化,提供一种更高效的方法来解决移动边缘计算中的高维问题和不确定性场景,结果显示机器学习模型相对传统方法具有显著的解决时间改进。
- 多种重尾、非 Lipschitzian 及高维情况下,(正则化的) 样本平均逼近的新样本复杂性界
本文研究了在重尾性、非 Lipschitz 性和 / 或高维度下解决凸随机规划问题中样本平均逼近(SAA)及其简单变形,即正则化 SAA(RSAA)的样本复杂度。通过三组结果,论文表明 (R) SAA 在目标函数不一定是 Lipschitz - 不确定情况下决策上下文优化方法综述
本文介绍了结合预测算法和优化技术来解决不确定性决策问题的上下文优化领域。文中关注单一和两阶段随机规划问题,识别了三种从数据中学习策略的主要框架,并讨论了它们的优点和局限性。
- 基于数据的分段仿射决策规则的随机规划与协变量信息
利用经验风险最小化方法嵌入非凸分段仿射决策规则,学习从特征到最优决策的映射,提出 PADR 基于 ERM 方法,并证明了其在无约束问题上非渐进一致性和带约束问题上渐进一致性,利用 SM 算法解决非凸非可分 ERM 问题,建立其复杂度分析,表 - 凸多阶段随机优化的数值方法
本文研究了在随机环境中涉及顺序决策的优化问题,主要集中于随机规划和随机最优控制建模方法,通过切割平面逼近和随机逼近类型的方法,有效解决了传统动态规划算法所面临的状态变量维度增加、计算复杂度指数级增长等问题,针对多阶段问题,提出了一种能够处理 - jsdp:Java 随机动态规划库
Stochastic Dynamic Programming 在处理不确定决策时采用函数方程方法,而 jsdp 实现了一种基于 Java 的 MapReduce 框架的泛用库用于建模和解决问题。
- Neur2SP:神经两阶段随机规划
本文提出了一种名为 Neur2SP 的方法,它通过神经网络近似预期值函数来解决计算上不可行的二阶随机编程模型,同时不假设问题结构并且可以使用现成的 MIP 求解器,并成功应用于四类基准问题。
- 神经渐进对冲:用随机规划在强化学习中强制执行约束
本文提出了一种名为神经渐进对冲的框架,该框架在强化学习策略执行的在线阶段利用随机规划来确保对约束和风险为基础的目标的可行性,特别适用于序列资源分配问题等一些无法可扩展地强制执行常见资源约束条件的问题,实验证明该框架比起深度强化学习和其他基线 - 数字孪生网络中随机计算卸载的深度强化学习
本文提出了一种新的数字孪生网络(DTN)模型来帮助 IIoT 系统中的网络拓扑和随机任务到达模型,进而将随机计算卸载和资源分配问题转化为 Lyapunov 优化问题,并使用异步 Actor-Critic 算法来找到最优的随机计算卸载策略和提 - 双工具变量回归
介绍了一种新颖的算法 DualIV 用以解决非线性仪器变量回归问题,并且通过凸 - 凹鞍点问题得到比传统二阶段方法更简化的方案,同时构建了一种基于核函数的解析算法,该算法与现有的更复杂算法相比具有竞争力。
- 利用支持向量机对 Benders 割分类在解决双阶段随机规划问题中的应用
本文提出了一种基于学习的 Benders 分解算法,使用支持向量机分类器识别关键切割面来加速解决双阶段随机规划问题,实验结果表明该方法可以显著降低不同大小和复杂度问题的求解时间。
- 联合地面和空中包裹投递服务:基于随机优化方法的研究
本文介绍了关于联合地面和空中交付服务优化和规划的框架,旨在最小化总交付成本并考虑到起飞和故障条件的不确定性。采用三阶段随机整数规划模型,并运用分解方法,以两个数据集进行性能评估,表明该框架比不考虑不确定性的基线方法具有明显的降低总支付的优势 - NIPS基于任务的随机优化端到端模型学习
本文提出了一种端到端的方法来学习概率机器学习模型,以便在随机编程的上下文中直接捕获它们将要使用的最终基于任务的目标,我们在经典库存问题,实际电力调度任务和实际能源存储套利任务中验证了该方法的有效性。
- 随机原始 - 对偶近端块坐标更新
本文提出了一种用于解决多块凸优化问题的随机 Primal-Dual 近端块坐标更新框架,并使用其达到 $O (1/t)$ 的收敛速度,且包含现有算法的特例,以及推广至解决随机编程的问题。
- 通过模拟退火逃离局部极小值:近似凸函数的优化
采用 Hit-and-Run 方法通过 log-concave 分布的采样来优化凸可行解,在 log-concave 分布的基础上扩展近似 log-concave 分布的分析, 并使 1D 采样器的实现需要新的方法和分析,应用于不同的激励问