- 使用软防护的安全强化学习对分布式灵活装配线进行调度
研究了基于 Actor-Critic 强化学习方法的自动化装配线调度问题,提出了一种更简洁的环境表示方法,并引入基于 Monte-Carlo 树搜索的软屏蔽组件来改善调度过程中的不安全行为和风险监控。
- 朝向持续学习的应用性能模型
基于机器学习的性能模型在构建关键的作业调度和应用程序优化决策中越来越被使用。我们开发了持续学习性能模型,考虑到数据分布漂移,减轻灾难性遗忘,并提高泛化能力。我们的最佳模型能够保持准确性,无论系统变化引起的新数据分布,同时相比于朴素方法,在整 - 基于深度强化学习的作业车间调度:一种序列到序列方法
通过自动学习调度规则,本文提出了一种原创的端到端深度强化学习方法来解决作业调度的 NP - 难度问题,该技术受到自然语言编码器 - 解码器模型的启发,可在最小干预下用于处理其他不同的优化作业调度任务。研究结果表明,我们在利用优先调度规则方面 - 一种强化学习方法用于通过排序交换提高泛化性能的调度问题
本文介绍了一种使用 DRL 求解 JSSP 问题的新方法,该方法使用了 PPO 算法并在环境中加入了 OSM 以实现更好的泛化学习,并在可用的基准实例集上进行了深入的性能分析和比较。
- 数据中心中可再生能源感知的资源管理
为了解决数据中心的能源消耗和环境影响,文章使用深度强化学习算法 (RARE) 设计了可适应可再生能源的任务调度策略,并证明了该方法相对传统启发式调度策略的性能更佳,同时还可以从离线学习中不断提高。
- 基于 GNN 的工作调度程序的可扩展验证
本文针对基于 GNN 的作业调度器在满足性能方面表现卓越的同时,关注其是否满足用户在战略稳健性、共享激励和稳定性等其他重要特性方面的期望,提出了一种用于验证 GNN 作业调度器的通用框架 vegas,并通过实验证明其比之前的方法更快速且更为 - 基于预测的调度与错误预测的代价
该文研究了在服务时间不确定且使用机器学习算法进行预测时的作业调度,提出了几个策略的性能公式,并引入了 “错误预测的代价” 框架来度量使用预测信息的成本。
- 车联网中的信息新鲜度和完成时间优化
本文研究了实时云应用中基于 IoT 设备更新信息的计算任务调度问题,并提出了基于信息新鲜度和完成时间的调度策略,以及优化这两个指标的凸优化模型和在线算法。模拟实验显示了该算法相比于基线方法的显著改进。
- 多资源多机器作业调度的深度强化学习
本文在最小化数据中心网络中的工作调度时间方面进行了深入研究,提出了一种基于深度强化学习的改进方法并将其扩展到多个服务器群集,结果表明,相比于传统的资源分配算法,深度强化学习方法在各种复杂环境中有着出色的性能表现。
- 并行调度的最优化
该研究探讨了如何在多核处理器上处理任务调度,提出了一种优化的任务并行化策略,其中固定宽度策略可以平衡系统效率和响应时间,并提出了一种名为 GREEDY * 的新策略来处理速度加速曲线不同的情况。