基于深度学习交通系统的后门抵消的最优平滑分布探索

Mar, 2023

基于深度学习交通系统的后门抵消的最优平滑分布探索

Optimal Smoothing Distribution Exploration for Backdoor Neutralization in Deep Learning-based Traffic Systems

Yue Wang, Wending Li, Michail Maniatakos, Saif Eddin Jabari

TL;DR该研究提出了一种基于噪声分布的优化平滑方法，用于深度强化学习自主车辆控制器，旨在中和后门攻击并减少交通拥堵。

Abstract

deep reinforcement learning (DRL) enhances the efficiency of Autonomous Vehicles (AV), but also makes them susceptible to backdoor attacks that can result in →

deep reinforcement learning autonomous vehicles backdoor attacks noise distribution traffic congestion

发现论文，激发创造

探索基于深度强化学习的交通拥堵控制系统后门攻击：Stop-and-Go

本文探讨了基于深度强化学习的自动驾驶车辆控制器中的后门攻击以及特定条件下的拥堵攻击和保险攻击，在交通物理原理的基础上设计了触发策略，并在单车道和双车道环路上进行了测试。实验结果表明，攻击并未明显降低正常操作性能，但在特定条件下可被激活以导致事故或拥堵。

Mar, 2020

通过随机平滑验证针对后门攻击的鲁棒性

本研究研究证明采用随机平滑技术可用于认证抵御后门攻击的鲁棒性，并探讨了现有方法的局限性，强调需要新的理论和方法来认证抵御后门攻击的鲁棒性。

Feb, 2020

通过随机平滑技术实现对深度学习恶意软件检测器的实用防御

基于深度学习的恶意软件检测器对于被有意修改以逃避检测的恶意软件实例，即对抗性恶意软件实例，显示出易受攻击。为了应对深度学习检测器的这种脆弱性，我们提出了一个受随机平滑启发的针对对抗性恶意软件实例的实用防御方案。该方案使用随机消融平滑的方式训练基于消融版本的可执行文件的基础分类器，在测试时，根据分类器对原始可执行文件的一组消融版本进行的预测，将给定输入可执行文件的最常见预测类作为最终分类。实验证明，相比未经平滑处理的分类器，我们提出的基于消融的模型在 BODMAS 数据集上对各种最先进的规避攻击表现出更高的鲁棒性和泛化能力。

Aug, 2023

基于深度强化学习和真实世界轨迹数据的无人车交通平滑控制器

通过使用田纳西州 I-24 高速公路的实际轨迹数据，在一条车道的仿真中运行深度强化学习方法来训练减少能耗的波浪平滑策略，我们展示了在低 4% 的自动驾驶车辆渗透率下，对于出现许多停停走走波浪的轨迹，可以实现超过 15% 的显著节省燃料，分析了控制器的平滑效果以及对仿真中添加车道变更和消除下游信息的鲁棒性。

Jan, 2024

可验证强化学习的策略平滑算法

本文针对强化学习中的深度神经网络，提出了一种能够直接认证总奖励且无需在每一时间步骤都保持鲁棒性的有效方法，其中使用了采样平滑和基于样条插值的鲁棒性证明。

Jun, 2021

基于策略深度强化学习和智能路由的自主车辆交通管理

提出了一种基于深度强化学习的信号控制系统，该系统可以根据交通状况动态调整信号并使用重新路由技术平衡道路网络上的车辆，以帮助优化交通流的管理和减少拥堵。

Jun, 2022

Elijah：通过分布变化消除扩散模型中注入的后门

我们提出了第一个扩散模型的后门检测和清除框架，通过对数百种扩散模型进行评估，实验证明我们的方法可以几乎百分之百地检测出后门，并将后门效果减少到接近零，而不明显损害模型的效用。

Nov, 2023

通过深度强化学习实现平滑轨迹避碰

本论文针对 DRL 导航解决方案中的两个核心问题提出了多种新的代理状态和奖励函数设计，即平滑性训练轨迹和模型泛化能力，利用边缘奖励和平滑度约束来确保无人机平稳飞行，同时大大降低碰撞风险，并演示整个设计和各组件的有效性。

Oct, 2022

DisDet：探索扩散模型上后门攻击的可检测性

首次从防守者和攻击者的角度对扩散模型进行了系统研究，探索了被破坏的扩散模型中毒噪声输入的可检测性和躲避机制，并提出了基于分布差异的低成本触发器检测方法。

Feb, 2024

基于 (De) Randomized Smoothing 的深度学习恶意软件检测器的对抗鲁棒性

深度学习恶意软件检测器容易受到对抗性恶意软件样本的攻击，我们提出了一种受（去）随机化平滑启发的针对对抗性恶意软件样本的实用防御方案，通过选择相关的字节子集来降低恶意软件作者注入的对抗性内容的采样概率，而不像计算机视觉领域中一样使用高斯噪声来随机化输入。我们提出了两种确定用于分类的块位置的策略：（1）随机选择块的位置和（2）选择连续相邻的块。我们的研究结果显示，基于块的平滑分类器对使用最新的对抗性恶意软件逃避攻击生成的对抗性恶意软件示例表现出更高的韧性，明显优于非平滑分类器和基于随机化平滑的分类器。

Feb, 2024