基于 P-MADDPG 的紧急事件决策

Mar, 2022

Decision-making of Emergent Incident based on P-MADDPG

Yibo Guo, Lishuo Hou, Mingxin Li, Yue Yuan, Shun Liu...

TL;DR本文提出了一种用于应对紧急事件决策问题的 P-MADDPG 算法，模拟紧急情况下的三种场景测试其性能，结果证明相比于其他算法，P-MADDPG 算法在不同规模的场景中收敛更快更好，因此是有效的。

Abstract

In recent years, human casualties and damage to resources caused by emergent incidents have become a serious problem worldwide. In this paper, we model the emergency decision-making problem and use multi-agent system

emergency decision-making multi-agent system p-maddpg algorithm emergent incidents simulation results

发现论文，激发创造

一种人机协同应急处置决策方法

本研究提出一种基于人机协同的方法，通过任务过滤和任务调度两个阶段，提高快速解决问题的效率和准确性。在任务过滤中使用 GACRNN 模型进行机器预测，由人类决策者实时监管并修改确认，而任务调度中将事件决策步骤插入到正常作业序列中，以缩小对原计划的影响。

May, 2023

应对不确定性复合情境下的紧急疏散优先安排

本文提出并分析了一个紧急疏散决策支持工具，并探索其在阿富汗撤离行动中的应用。使用马尔科夫决策过程等多种方法捕捉了疏散过程中的不确定性，并比较了不同启发式策略的效果，其中最优的马尔科夫决策过程策略在优先级分类下疏散了最多的人员，并提取其中的重要启发式规则以帮助人类决策者，并希望开源所有工具以促进关于算法在高风险人道主义决策中整合的讨论

Sep, 2022

基于贝叶斯网络和深度强化学习的具有概率依赖性的退化系统的推断和动态决策

本文提出了一种面向环境退化的工程系统的决策算法框架，通过部分可观察性马尔可夫决策过程来处理决策问题，采用深度去中心化多智能体演员 - 评论家强化学习方法对其进行优化，在工程领域实验表明，DDMAC 策略较之现状启发式方法提供了实质性的优势，并且 DDMAC 策略已内在地考虑了系统效应。

Sep, 2022

用于部分可观察环境和有限通信的 R-MADDPG

本文介绍了一种使用深度循环多智能体演员 - 评论家框架（R-MADDPG）处理部分可观测设置和有限通信下多智能体协调的方法，并探究了循环效应对团队智能体表现和通信使用的影响。研究结果表明，该框架可以学习随时间变化的依赖关系，处理资源限制，并在智能体之间开发不同的通信模式。

Feb, 2020

应用集成优化和机器学习模型预测急诊病人的入院状态

本文提出了一种基于机器学习算法优化的框架，以急诊部门的患者入院情况为例进行实证研究，利用大规模的患者数据和三种新的机器学习算法对传统算法进行对比，结果表明新算法在 AUC 等五个指标上表现更好，其中 T-ADAB 算法效果最佳，最优模型的 AUC、灵敏度、特异度、F1 和准确率分别达到 95.4%、99.3%、91.4%、95.2% 和 97.2%。

Feb, 2022

多智能体深度强化学习（MADRL）遇见多用户 MIMO 系统

本文提出了一种 MADRL 的方法，即采用 MA-DDPG 框架，在有多个决策制定者并且这些决策制定者只能观测到部分环境信息，且存在多维度动作空间的情况下，在多输入单输出干扰信道系统中联合优化预编码器，来实现可实现速率区域的边界，同时提出了一种解决相位歧义问题的训练方法（PAE），模拟结果表明这种方法在 MISO IFC 系统中可以学习到近乎最优的预编码策略，并且这是第一篇在多个蜂窝、多用户、多天线系统中证明 MA-DDPG 框架可以联合优化预编码器以达到可实现速率区域的边界的研究。

Sep, 2021

物联网环境下应急救援的多约束和多目标分配模型

利用物联网和时空数据分析，我们开发了多目标洗牌灰狼青蛙跳模型（MSGW-FLM），该模型在应对复杂的多周期紧急救援场景中显示出了卓越的性能，为优化应急救援资源分配迈出了重要的一步。

Mar, 2024

使用引导分支的高效自动驾驶不确定性感知决策

该研究提出了一种高效的不确定性感知决策框架（EUDM），利用专家知识指导行动和愿望空间的分支，以控制计算复杂度，实时生成复杂驾驶环境下的长期横向和纵向行为，同时还提供代码以适应基准测试。

Mar, 2020

应急响应人工智能

本教程论文探讨应急响应中的四个子问题：事件预测、事件检测、资源分配和资源调度。同时提供在美国大都市地区的开放数据进行数据驱动的应急响应研究和工作。

Jun, 2023

具有延迟的强大多智能体取送货

本文研究带延迟的 Multi-Agent Pickup and Delivery 问题，提出了两种算法，基于 Token Passing 算法提供确定性和概率性的保证，在实验中，算法表现出了较好的有效性和健壮性，尤其是减少了重规划的次数。

Mar, 2023