基于 P-MADDPG 的紧急事件决策
本研究提出一种基于人机协同的方法,通过任务过滤和任务调度两个阶段,提高快速解决问题的效率和准确性。在任务过滤中使用 GACRNN 模型进行机器预测,由人类决策者实时监管并修改确认,而任务调度中将事件决策步骤插入到正常作业序列中,以缩小对原计划的影响。
May, 2023
本文提出并分析了一个紧急疏散决策支持工具,并探索其在阿富汗撤离行动中的应用。使用马尔科夫决策过程等多种方法捕捉了疏散过程中的不确定性,并比较了不同启发式策略的效果,其中最优的马尔科夫决策过程策略在优先级分类下疏散了最多的人员,并提取其中的重要启发式规则以帮助人类决策者,并希望开源所有工具以促进关于算法在高风险人道主义决策中整合的讨论
Sep, 2022
本文提出了一种面向环境退化的工程系统的决策算法框架,通过部分可观察性马尔可夫决策过程来处理决策问题,采用深度去中心化多智能体演员 - 评论家强化学习方法对其进行优化,在工程领域实验表明,DDMAC 策略较之现状启发式方法提供了实质性的优势,并且 DDMAC 策略已内在地考虑了系统效应。
Sep, 2022
本文介绍了一种使用深度循环多智能体演员 - 评论家框架(R-MADDPG)处理部分可观测设置和有限通信下多智能体协调的方法,并探究了循环效应对团队智能体表现和通信使用的影响。研究结果表明,该框架可以学习随时间变化的依赖关系,处理资源限制,并在智能体之间开发不同的通信模式。
Feb, 2020
本文提出了一种基于机器学习算法优化的框架,以急诊部门的患者入院情况为例进行实证研究,利用大规模的患者数据和三种新的机器学习算法对传统算法进行对比,结果表明新算法在 AUC 等五个指标上表现更好,其中 T-ADAB 算法效果最佳,最优模型的 AUC、灵敏度、特异度、F1 和准确率分别达到 95.4%、99.3%、91.4%、95.2% 和 97.2%。
Feb, 2022
本文提出了一种 MADRL 的方法,即采用 MA-DDPG 框架,在有多个决策制定者并且这些决策制定者只能观测到部分环境信息,且存在多维度动作空间的情况下,在多输入单输出干扰信道系统中联合优化预编码器,来实现可实现速率区域的边界,同时提出了一种解决相位歧义问题的训练方法(PAE),模拟结果表明这种方法在 MISO IFC 系统中可以学习到近乎最优的预编码策略,并且这是第一篇在多个蜂窝、多用户、多天线系统中证明 MA-DDPG 框架可以联合优化预编码器以达到可实现速率区域的边界的研究。
Sep, 2021
利用物联网和时空数据分析,我们开发了多目标洗牌灰狼青蛙跳模型(MSGW-FLM),该模型在应对复杂的多周期紧急救援场景中显示出了卓越的性能,为优化应急救援资源分配迈出了重要的一步。
Mar, 2024
该研究提出了一种高效的不确定性感知决策框架(EUDM),利用专家知识指导行动和愿望空间的分支,以控制计算复杂度,实时生成复杂驾驶环境下的长期横向和纵向行为,同时还提供代码以适应基准测试。
Mar, 2020
本文研究带延迟的 Multi-Agent Pickup and Delivery 问题,提出了两种算法,基于 Token Passing 算法提供确定性和概率性的保证,在实验中,算法表现出了较好的有效性和健壮性,尤其是减少了重规划的次数。
Mar, 2023