具有空间不确定警报信号的对抗性巡逻

Jun, 2015

具有空间不确定警报信号的对抗性巡逻

Adversarial patrolling with spatially uncertain alarm signals

Nicola Basilico, Giuseppe De Nittis, Nicola Gatti

TL;DR研究了在安全性方面，如何应对范围较大，常常有不确定信号的情况下，使用可提高安全策略有效性的巡逻模型，并提供了多种算法来应对不同拓扑结构，实现最佳策略的优化。

Abstract

When securing complex infrastructures or large environments, constant surveillance of every area is not affordable. To cope with this issue, a common countermeasure is the usage of cheap but wide-ranged sensors, able to detect suspicious events that occur in large areas, supporting patrollers to improve the effectiveness of their strategies. However, such se

发现论文，激发创造

基于实时信息的绿色安全游戏的深度强化学习

本研究提出了一种新的游戏模型GSG-I，结合了顺序移动和实时信息等关键元素，设计了基于双预言机框架和策略空间响应预言机的深度强化学习算法DeDOL来计算巡逻策略，以对抗最佳响应的攻击者，探索游戏结构使用领域特定启发式策略和构建多个局部模态以进行高效和并行化训练。这是首次尝试将深度Q-Learning应用于安全游戏。

Nov, 2018

安全博弈中对手行为的端到端游戏集中学习

本文介绍了一种新的以博弈为重点的方法，以解决对于一个新的特征值和组合的目标普遍化防御的问题，结果表明在数据受限的情况下，这种方法可实现比传统方法更高的防御者预期效益。

Mar, 2019

双重职责巡逻：绿色安全的多臂赌博算法

该论文介绍了LIZARD算法，它是基于多臂赌博算法的一种方法，帮助保护濒危动物和森林资源的巡逻策略选择，并优化了短期表现。

Sep, 2020

绿色安全中极小后悔的强化学习

该研究旨在针对绿色安全领域中的不确定性制定有韧性的顺序巡逻计划，以解决对保护者来说具有威慑效应的问题，并提出了一种基于强化学习的算法来找到一个更加稳健的决策策略。

Jun, 2021

噪声安全游戏攻防交互模拟

为了提高防御者的战术优势，本文通过引入一种安全游戏框架，模拟了攻击者和防御者在各种不同知晓程度和情境下的决策方式，并探究了在真假报警间取得平衡的方法。

Dec, 2022

复杂环境中高效稳健的传感器布置

在复杂环境中，我们解决了高效和无障碍监视或通信的问题，通过使用最少数量的传感器覆盖环境，并考虑对传感器故障或对抗性攻击具有鲁棒性的解决方案。我们提出了一种贪婪算法来实现多覆盖约束的最小传感器集设计目标，并探索了使用深度学习技术加速贪婪算法中目标函数的评估。神经网络的训练揭示了数据的几何特性显著影响网络性能，特别是在最后阶段。通过考虑这些特性，我们讨论了使用贪婪算法和ϵ-贪婪算法生成数据的差异及其对网络的鲁棒性的影响。

Sep, 2023

多防卫者安全博弈与日程安排

研究了包含多个卫士和时间表的安全游戏，发现时间表的引入可能导致平衡不存在，但在特定条件下，能够在多个卫士的游戏中以多项式时间计算避免平衡不存在的问题。

Nov, 2023

分散式多智能体主动搜索和追踪：当目标超过智能体数量

多智能体多目标追踪问题中的去中心化、主动搜索和跟踪以及异步智能体通信的解决方案 DecSTER，在目标数量超过智能体数量的情况下，通过使用概率假设密度滤波器的顺序蒙特卡罗算法进行后验推断，并结合汤普森采样进行智能体的分散决策。通过比较不同的动作选择策略，在模拟中证明了 DecSTER 算法在面对不可靠智能体通信时的鲁棒性，并在不同目标数量和团队规模下优于信息贪婪基准的优化子模式分配 (OSPA) 指标。

Jan, 2024

优化多覆盖感知网络设计

传感器布置优化方法研究广泛，但很少有研究考虑到传感器网络在传感器故障或对抗性攻击方面的鲁棒性和效率。本文通过优化寻找最少数量的传感器来实现预定数量传感器对非连通域进行多次覆盖，从而解决了这个问题。我们提出了一种新的目标函数用于贪婪算法设计高效而鲁棒的传感器网络，并推导出了网络的可优化性的理论界限。我们进一步引入了一个深度学习模型加速算法以进行近实时计算。该深度学习模型需要生成训练样本，相关地，我们展示了了解训练数据集的几何属性对深度学习技术的性能和训练过程提供了重要见解。最后，我们展示了使用较简单目标的简单并行贪婪方法可以具有很高的竞争力。

May, 2024

在动态犯罪场景中解决交通网络上的Stackelberg博弈：多层网络的混合方法

应用层次图和斯塔克伯格博弈探讨警方资源有限时打击犯罪分子的有效策略，结果表明该方法在短时间内能够高效解决复杂问题。

Jun, 2024