随机最短路径问题的变体

Nov, 2014

Variations on the Stochastic Shortest Path Problem

Mickael Randour, Jean-François Raskin, Ocan Sankur

TL;DR本文介绍了关于随机最短路径问题的算法和策略，提供多种保证路径长度分布，而不仅是期望值最小的解决方案，并对最近在马尔科夫决策过程的研究成果进行了应用。

Abstract

In this invited contribution, we revisit the stochastic shortest path problem, and show how recent results allow one to improve over the classical solutions: we present algorithms to synthesize strategies with mu

stochastic shortest path problem algorithms strategies markov decision processes distribution

发现论文，激发创造

用于自主车辆行为规划的概率约束随机最短路径双重描述

本文介绍了一个基于约束的随机规划问题，其中利用整数线性规划方法确保了确定性决策，同时为安全性关键的应用提供了约束违规概率的上界。同时还介绍了确定性策略和随机策略的随机舍入过程，并探讨了如何在考虑不同时间步的约束情况下进行 CC-SSP 的推广。

Feb, 2023

乐观策略迭代在随机最短路径问题上的收敛性

本文研究了乐观策略迭代算法在随机最短路径问题中的收敛性，考虑了蒙特卡罗和 $TD (\lambda)$ 方法在策略评估步骤中的应用。

Aug, 2018

带有对手可变成本的随机最短路径

本文提出了对抗性 SSP 模型，包含时间上对成本的不良变化和未知转移，其开发了第一个对抗性 SSP 算法，并证明了高概率的回报上限。

Jun, 2020

未知和随机变化链路状态下的适应性最短路径路由

研究无线网络中未知和随机变化的连接状态下自适应最短路径路由问题，通过多臂赌博机模型，利用不同臂之间的依赖关系实现了多项式级别的后悔率，适用于具有未知和动态通信环境的认知无线电和自组织网络。

Jan, 2012

随机最短路径的近最优遗憾边界

本文介绍了一种解决随机最短路径问题的算法，其中代理必须通过在有限次数的游戏中获得最佳策略，从而在最短期望代价下达到目标状态。通过探究悔恨最小化和最小瞬时代价的根号反比关系，本文提出了一种不依赖于最小代价的算法，并展示了任何学习算法在最坏情况下都要有至少 Omega（Bstar 根号乘以 S、A、K 的数量）的悔恨。

Feb, 2020

随机最短路径问题的次优解界

通过计算动态规划算子的 Bellman 残差，我们可以计算出随机最短路径问题解的次优性界限。在考虑到过渡成本为正的情况下，即使不是所有的策略都是正确的，我们也可以轻松地计算次优性界限。

Feb, 2012

自主探索与多目标随机最短路径的近最优算法

该研究重新审视了 Lim＆Auer（2012）提出的增量自主探索问题，提出了一种新算法，并证明了该算法在控制状态数多项式增长时是几乎极小化的。

May, 2022

具有多个边成本估计的图的最短路径问题的推广

本文提供了一种面向带权有向图的广义框架，可以计算（估算）多次边权重，并以不同准确性和运行时开销进行优化，从而提出了一个最短路径问题的广义形式。我们介绍了该问题的一个完整的任何时刻的解法算法，并在实验中证明了其有效性。

Aug, 2022

基于风险的随机最短路径

本研究针对马尔科夫决策过程中随机最短路径问题提出了一种基于条件风险价值优化的风险感知控制方法，并通过线性规划和价值迭代两种算法实现了精确而可靠的解决方案。实验结果表明该方法在多个中等规模的问题实例上是可行的。

Mar, 2022

在线部分监督下的最短路径问题

研究了在线最短路径问题及其各种监控模型，在加权有向无环图中寻找一条路径以使其对应的边权和尽可能小。提出了一种算法，将累积损失最小化，并介绍了其应用于包交换网络中路由的模拟结果。

Apr, 2007