通过将多任务学习应用于机器学习算法中,结合 Elastic Weight Consolidation 和 Gradient Episodic Memory 的方法,并与增强训练数据分布的现有技术进行比较,本研究证明多任务方法对处理医疗领域等特殊需求的稀有重大事件有很高的效果。
Apr, 2023
本文通过建立数据集,利用深度强化学习求解器,采用新的鲁棒混合整数线性规划模型,解决了不确定自主清洁系统中多机器人混合任务分配的问题,并且可以在保持性能的情况下,防止系统出现最坏情况,同时提供了一个基准数据集。
Mar, 2023
通过去中心化强化学习,提出一种多智能体团队任务分配的决策框架,考虑负载管理,鼓励闲置并避免不必要的资源使用。开发了一个衡量智能体在协作中重要性的指标,推断团队在处理潜在的过载情况时的弹性。
Jul, 2022
本文介绍一个通用的、广泛涉及机器人、计算机科学、运筹学和人工智能等领域的任务分配问题,包括机器人、任务和周围环境状态的多个版本,并探讨了解决该问题的现有方法,包括基于优化和市场的方法。
本文旨在研究如何实现计算任务从移动代理转移,其提出了一种基于分散决策的机制来促使代理间在博弈与合作之间平衡。为此,该文设计了一个新的多代理在线学习算法,并通过 V2X 应用的模拟得出了良好的收敛性和泛化性能。
我们提出了一个基于角色的多智能体强化学习框架,该框架使用角色分配网络将学习代理分配到团队中,以适应不同的团队大小,并通过 StarCraft II 模拟来展示该方法的有效性。
Apr, 2022
本文介绍了一种图嵌入式的编码器 - 解码器框架,以实现在流处理中分配资源任务,同时确保工作负载平衡和通信最小化。采用深度强化学习方法,有效地学习和求解未知图的最优解,并在测试中表现优于 METIS 算法和基于 LSTM 的编码器 - 解码器模型约 70%。
Nov, 2019
本研究通过利用人类 - 任务相似性的弱先验信息来启动模型训练,改善任务分配的准确性,尤其是在人类决策者存在错误和偏见的情况下,在合成数据和社交媒体毒性检测任务上得到了实证验证。
May, 2023
该研究提出了一个基于行为树的动态集成方法,用于规划和分配混合人机团队中的任务,可用于制造环境,并采用多个简化的在线优化子问题中解决角色分配问题,每个子问题都可以定义为混合整数线性规划。
May, 2021
本文探讨了使用无人机作为空中基站提供无线通信服务的动态资源分配问题,并通过多智能体强化学习框架实现了长期收益的最大化。研究结果表明,该算法在信息交互开销和性能提升之间取得了良好的平衡。
Oct, 2018