基于两阶段强化学习的多实体任务分配方法

Jun, 2024

基于两阶段强化学习的多实体任务分配方法

A Two-stage Reinforcement Learning-based Approach for Multi-entity Task Allocation

Aicheng Gong, Kai Yang, Jiafei Lyu, Xiu Li

TL;DR基于相似性的双阶段任务分配算法利用强化学习来学习优化分配策略，有效解决了动态任务分配的挑战，并具有良好的性能和零样本泛化能力。

Abstract

task allocation is a key combinatorial optimization problem, crucial for modern applications such as multi-robot cooperation and resource scheduling. Decision makers must allocate entities to tasks reasonably acr

task allocation combinatorial optimization reinforcement learning markov decision processes dynamic task allocation

发现论文，激发创造

一种多任务方法的鲁棒深度强化学习用于资源分配

通过将多任务学习应用于机器学习算法中，结合 Elastic Weight Consolidation 和 Gradient Episodic Memory 的方法，并与增强训练数据分布的现有技术进行比较，本研究证明多任务方法对处理医疗领域等特殊需求的稀有重大事件有很高的效果。

Apr, 2023

实用化多机器人混合任务分配：自主清洁

本文通过建立数据集，利用深度强化学习求解器，采用新的鲁棒混合整数线性规划模型，解决了不确定自主清洁系统中多机器人混合任务分配的问题，并且可以在保持性能的情况下，防止系统出现最坏情况，同时提供了一个基准数据集。

Mar, 2023

多代理团队中的负载管理任务分配

通过去中心化强化学习，提出一种多智能体团队任务分配的决策框架，考虑负载管理，鼓励闲置并避免不必要的资源使用。开发了一个衡量智能体在协作中重要性的指标，推断团队在处理潜在的过载情况时的弹性。

Jul, 2022

使用机器人团队的任务分配

本文介绍一个通用的、广泛涉及机器人、计算机科学、运筹学和人工智能等领域的任务分配问题，包括机器人、任务和周围环境状态的多个版本，并探讨了解决该问题的现有方法，包括基于优化和市场的方法。

Jul, 2022

多智能体强化学习在基于竞拍的长期网络资源分配中的应用：V2X 应用

本文旨在研究如何实现计算任务从移动代理转移，其提出了一种基于分散决策的机制来促使代理间在博弈与合作之间平衡。为此，该文设计了一个新的多代理在线学习算法，并通过 V2X 应用的模拟得出了良好的收敛性和泛化性能。

Jul, 2022

学习在团队规模间转移角色分配

我们提出了一个基于角色的多智能体强化学习框架，该框架使用角色分配网络将学习代理分配到团队中，以适应不同的团队大小，并通过 StarCraft II 模拟来展示该方法的有效性。

Apr, 2022

基于深度强化学习的流处理通用资源分配

本文介绍了一种图嵌入式的编码器 - 解码器框架，以实现在流处理中分配资源任务，同时确保工作负载平衡和通信最小化。采用深度强化学习方法，有效地学习和求解未知图的最优解，并在测试中表现优于 METIS 算法和基于 LSTM 的编码器 - 解码器模型约 70％。

Nov, 2019

任务分配的闭环模型设计

本研究通过利用人类 - 任务相似性的弱先验信息来启动模型训练，改善任务分配的准确性，尤其是在人类决策者存在错误和偏见的情况下，在合成数据和社交媒体毒性检测任务上得到了实证验证。

May, 2023

混合人机团队角色分配与任务规划的一体化动态方法

该研究提出了一个基于行为树的动态集成方法，用于规划和分配混合人机团队中的任务，可用于制造环境，并采用多个简化的在线优化子问题中解决角色分配问题，每个子问题都可以定义为混合整数线性规划。

May, 2021

基于多智能体强化学习的无人机网络资源分配

本文探讨了使用无人机作为空中基站提供无线通信服务的动态资源分配问题，并通过多智能体强化学习框架实现了长期收益的最大化。研究结果表明，该算法在信息交互开销和性能提升之间取得了良好的平衡。

Oct, 2018