以不安静强盗策略为特点的机会调度

Jun, 2017

以不安静强盗策略为特点的机会调度

Opportunistic Scheduling as Restless Bandits

Vivek S. Borkar, Gaurav S. Kasbekar, Sarath Pattathil, Priyesh Y. Shetty

TL;DR本文研究了多用户情况下的能源效率调度问题，考虑了有限队列、延迟和传输能量耗费对传输的影响，采用 Whittle index 方法计算用户优先级，结果表明该算法优于最大权重调度和加权公平调度策略。

Abstract

In this paper we consider energy efficient scheduling in a multiuser setting where each user has a finite sized queue and there is a cost associated with holding packets (jobs) in each queue (modeling the delay c

energy efficient scheduling multiuser cost function common channel whittle index

发现论文，激发创造

作为不安静的强盗的截止日期调度

研究了随机截止时间调度问题，提出了一种约束马尔科夫决策过程模型，该模型中工作随机到达，具有随机作业大小、奖励和完成期限。该服务提供商面临随机处理成本、凸非完成罚款和容量约束，以限制工作的同时处理。将随机截止时间调度问题建立为一个不安定的多臂赌博机问题，表明其可指标化。当处理成本为常量时，获得了 Whittle 指数的闭式表达式。获得了 Whittle 指数策略的最优解上限，并表明随着职位到达率和可用处理器数量同时增加到无限大，上限收敛于零。

Oct, 2016

焦虑赌博问题的可索引性与 Whittle 动态多通道访问指数的最优性

研究了一类探索性多臂赌博问题，并通过建立指标化和获得 Whittle 指标，提高了 Whittle 指标策略的直接实施性，同时，研究发现 Whittle 指标策略与 “近视政策” 等价，因此具有半通用性，这导致 Whittle 指标策略是某些条件下最优的。同时，通过拉格朗日弛豫，开发了计算性能上限的有效算法，证明了 Whittle 指标策略接近最优。

Oct, 2008

一个能量收集通信系统中的最优数据包调度

本文研究了单用户能量收集无线通信系统中最优数据包调度问题，以适应流量负荷和可用能量，并开发了最优的离线调度策略，以最小化所有数据包被送达的时间.

Oct, 2010

信息时代：随机到达调度的惠特尔指数

从调度的角度研究信息时代，通过 Whittle 框架导出闭式 Whittle 指数并建立了指数性，提出了调度算法，并证明其接近最优调度算法。

Jan, 2018

多通道机会式接入：多次播放的不安定赌博模型

本文研究了随机控制问题在机会式频谱访问中的应用，提出了设计一种通道选择策略，以最大化预期折扣总报酬为目标，将问题与该类问题现有文献进行了讨论。

Oct, 2009

多用户多协助下的无线网络自适应视频流媒体

本文研究了无线网络中自适应视频流调度策略的优化设计问题，其中采用了 “分而治之” 的方法和 Lyapunov Drift Plus Penalty 方法，提出了两个子策略解决拥塞控制和传输调度问题，并提出了一种自适应估计最大排队延迟的方法。

Apr, 2013

可索引和不可索引的不安定赌博机的渐进最优优先策略

本文研究了多类不定期赌徒的渐近最优控制问题，并提出了一类优先级策略，证明了在全局吸引子属性和技术条件下其是渐近最优的。我们将流体缩放技术与线性规划结果相结合，证明了当赌徒可索引时，Whittle 的索引策略包含在我们的一类优先级策略中。我们总结提出一些结论，包括关于如何选择来自渐近最优策略类的优先级策略等方面。

Sep, 2016

异构网络最优分配的多玩家多臂赌博机

针对多个用户访问相同频道的自组织网络，本研究在缺乏中央协调时，使用探索和承诺策略，通过传输和感知信息的方式，实现接近最优的频道分配，进而提高网络吞吐量，同时击败了现有的算法。

Jan, 2019

基于不安分贝叶斯边际生产率指标的动态优先级分配

这篇论文介绍了作者在研究动态优先级分配的多个随机项目的困难算法和应用上所做的工作，主要集中于无休止劫匪索引的理论和算法方面，采用线性规划、经济学和多目标优化方法。MPI 政策是在多项目环境中经济合理的，并且 MPI 指数策略通常实现近乎最优的性能，远优于使用传统方法衍生的基准策略。

Apr, 2023

学习未知统计量的非静态无线网络调度

对于具有部分可观察和时变动力学的大规模无线网络，本文研究了一种面向广义干扰约束的无线网络的高效调度算法，其中平均到达率和平均服务率是未知的和非平稳的。我们提出了一种新颖的算法 MW-UCB 用于广义无线网络调度，它基于最大权重策略，并利用滑动窗口上限置信界来学习通道在非平稳情况下的统计特性。在平均服务率的可变性方面满足较弱的假设条件下，MW-UCB 在吞吐量上是最优的。具体而言，只要平均服务率在任何时间段内的总变化量在时间上增长的次线性，我们表明 MW-UCB 可以实现稳定区域任意靠近拥有完全通道统计信息的策略类的稳定区域。大量模拟验证了我们的理论结果，并展示了 MW-UCB 的良好性能。

Aug, 2023