本文介绍了一个基于约束的随机规划问题,其中利用整数线性规划方法确保了确定性决策,同时为安全性关键的应用提供了约束违规概率的上界。同时还介绍了确定性策略和随机策略的随机舍入过程,并探讨了如何在考虑不同时间步的约束情况下进行 CC-SSP 的推广。
Feb, 2023
本文研究了乐观策略迭代算法在随机最短路径问题中的收敛性,考虑了蒙特卡罗和 $TD (\lambda)$ 方法在策略评估步骤中的应用。
Aug, 2018
本文提出了对抗性 SSP 模型,包含时间上对成本的不良变化和未知转移,其开发了第一个对抗性 SSP 算法,并证明了高概率的回报上限。
Jun, 2020
研究无线网络中未知和随机变化的连接状态下自适应最短路径路由问题,通过多臂赌博机模型,利用不同臂之间的依赖关系实现了多项式级别的后悔率,适用于具有未知和动态通信环境的认知无线电和自组织网络。
Jan, 2012
本文介绍了一种解决随机最短路径问题的算法,其中代理必须通过在有限次数的游戏中获得最佳策略,从而在最短期望代价下达到目标状态。通过探究悔恨最小化和最小瞬时代价的根号反比关系,本文提出了一种不依赖于最小代价的算法,并展示了任何学习算法在最坏情况下都要有至少 Omega(Bstar 根号乘以 S、A、K 的数量)的悔恨。
Feb, 2020
通过计算动态规划算子的 Bellman 残差,我们可以计算出随机最短路径问题解的次优性界限。在考虑到过渡成本为正的情况下,即使不是所有的策略都是正确的,我们也可以轻松地计算次优性界限。
Feb, 2012
该研究重新审视了 Lim&Auer(2012)提出的增量自主探索问题,提出了一种新算法,并证明了该算法在控制状态数多项式增长时是几乎极小化的。
May, 2022
本文提供了一种面向带权有向图的广义框架,可以计算(估算)多次边权重,并以不同准确性和运行时开销进行优化,从而提出了一个最短路径问题的广义形式。我们介绍了该问题的一个完整的任何时刻的解法算法,并在实验中证明了其有效性。
Aug, 2022
本研究针对马尔科夫决策过程中随机最短路径问题提出了一种基于条件风险价值优化的风险感知控制方法,并通过线性规划和价值迭代两种算法实现了精确而可靠的解决方案。实验结果表明该方法在多个中等规模的问题实例上是可行的。
Mar, 2022
研究了在线最短路径问题及其各种监控模型,在加权有向无环图中寻找一条路径以使其对应的边权和尽可能小。提出了一种算法,将累积损失最小化,并介绍了其应用于包交换网络中路由的模拟结果。
Apr, 2007