May, 2021

使用线性函数逼近的随机最短路径问题的遗憾界限

TL;DR该研究提出了一种使用线性函数逼近算法的随机最短路径问题的算法,具有次线性regret、计算效率高、使用平稳策略等特点,是该领域内第一种此类算法。