具有空间不确定警报信号的对抗性巡逻
本研究提出了一种新的游戏模型GSG-I,结合了顺序移动和实时信息等关键元素,设计了基于双预言机框架和策略空间响应预言机的深度强化学习算法DeDOL来计算巡逻策略,以对抗最佳响应的攻击者,探索游戏结构使用领域特定启发式策略和构建多个局部模态以进行高效和并行化训练。这是首次尝试将深度Q-Learning应用于安全游戏。
Nov, 2018
本文介绍了一种新的以博弈为重点的方法,以解决对于一个新的特征值和组合的目标普遍化防御的问题,结果表明在数据受限的情况下,这种方法可实现比传统方法更高的防御者预期效益。
Mar, 2019
该研究旨在针对绿色安全领域中的不确定性制定有韧性的顺序巡逻计划,以解决对保护者来说具有威慑效应的问题,并提出了一种基于强化学习的算法来找到一个更加稳健的决策策略。
Jun, 2021
在复杂环境中,我们解决了高效和无障碍监视或通信的问题,通过使用最少数量的传感器覆盖环境,并考虑对传感器故障或对抗性攻击具有鲁棒性的解决方案。我们提出了一种贪婪算法来实现多覆盖约束的最小传感器集设计目标,并探索了使用深度学习技术加速贪婪算法中目标函数的评估。神经网络的训练揭示了数据的几何特性显著影响网络性能,特别是在最后阶段。通过考虑这些特性,我们讨论了使用贪婪算法和ϵ-贪婪算法生成数据的差异及其对网络的鲁棒性的影响。
Sep, 2023
多智能体多目标追踪问题中的去中心化、主动搜索和跟踪以及异步智能体通信的解决方案 DecSTER,在目标数量超过智能体数量的情况下,通过使用概率假设密度滤波器的顺序蒙特卡罗算法进行后验推断,并结合汤普森采样进行智能体的分散决策。通过比较不同的动作选择策略,在模拟中证明了 DecSTER 算法在面对不可靠智能体通信时的鲁棒性,并在不同目标数量和团队规模下优于信息贪婪基准的优化子模式分配 (OSPA) 指标。
Jan, 2024
传感器布置优化方法研究广泛,但很少有研究考虑到传感器网络在传感器故障或对抗性攻击方面的鲁棒性和效率。本文通过优化寻找最少数量的传感器来实现预定数量传感器对非连通域进行多次覆盖,从而解决了这个问题。我们提出了一种新的目标函数用于贪婪算法设计高效而鲁棒的传感器网络,并推导出了网络的可优化性的理论界限。我们进一步引入了一个深度学习模型加速算法以进行近实时计算。该深度学习模型需要生成训练样本,相关地,我们展示了了解训练数据集的几何属性对深度学习技术的性能和训练过程提供了重要见解。最后,我们展示了使用较简单目标的简单并行贪婪方法可以具有很高的竞争力。
May, 2024
应用层次图和斯塔克伯格博弈探讨警方资源有限时打击犯罪分子的有效策略,结果表明该方法在短时间内能够高效解决复杂问题。
Jun, 2024