基于深度学习交通系统的后门抵消的最优平滑分布探索
本文探讨了基于深度强化学习的自动驾驶车辆控制器中的后门攻击以及特定条件下的拥堵攻击和保险攻击,在交通物理原理的基础上设计了触发策略,并在单车道和双车道环路上进行了测试。实验结果表明,攻击并未明显降低正常操作性能,但在特定条件下可被激活以导致事故或拥堵。
Mar, 2020
基于深度学习的恶意软件检测器对于被有意修改以逃避检测的恶意软件实例,即对抗性恶意软件实例,显示出易受攻击。为了应对深度学习检测器的这种脆弱性,我们提出了一个受随机平滑启发的针对对抗性恶意软件实例的实用防御方案。该方案使用随机消融平滑的方式训练基于消融版本的可执行文件的基础分类器,在测试时,根据分类器对原始可执行文件的一组消融版本进行的预测,将给定输入可执行文件的最常见预测类作为最终分类。实验证明,相比未经平滑处理的分类器,我们提出的基于消融的模型在 BODMAS 数据集上对各种最先进的规避攻击表现出更高的鲁棒性和泛化能力。
Aug, 2023
通过使用田纳西州 I-24 高速公路的实际轨迹数据,在一条车道的仿真中运行深度强化学习方法来训练减少能耗的波浪平滑策略,我们展示了在低 4% 的自动驾驶车辆渗透率下,对于出现许多停停走走波浪的轨迹,可以实现超过 15% 的显著节省燃料,分析了控制器的平滑效果以及对仿真中添加车道变更和消除下游信息的鲁棒性。
Jan, 2024
提出了一种基于深度强化学习的信号控制系统,该系统可以根据交通状况动态调整信号并使用重新路由技术平衡道路网络上的车辆,以帮助优化交通流的管理和减少拥堵。
Jun, 2022
我们提出了第一个扩散模型的后门检测和清除框架,通过对数百种扩散模型进行评估,实验证明我们的方法可以几乎百分之百地检测出后门,并将后门效果减少到接近零,而不明显损害模型的效用。
Nov, 2023
本论文针对 DRL 导航解决方案中的两个核心问题提出了多种新的代理状态和奖励函数设计,即平滑性训练轨迹和模型泛化能力,利用边缘奖励和平滑度约束来确保无人机平稳飞行,同时大大降低碰撞风险,并演示整个设计和各组件的有效性。
Oct, 2022
首次从防守者和攻击者的角度对扩散模型进行了系统研究,探索了被破坏的扩散模型中毒噪声输入的可检测性和躲避机制,并提出了基于分布差异的低成本触发器检测方法。
Feb, 2024
深度学习恶意软件检测器容易受到对抗性恶意软件样本的攻击,我们提出了一种受(去)随机化平滑启发的针对对抗性恶意软件样本的实用防御方案,通过选择相关的字节子集来降低恶意软件作者注入的对抗性内容的采样概率,而不像计算机视觉领域中一样使用高斯噪声来随机化输入。我们提出了两种确定用于分类的块位置的策略:(1)随机选择块的位置和(2)选择连续相邻的块。我们的研究结果显示,基于块的平滑分类器对使用最新的对抗性恶意软件逃避攻击生成的对抗性恶意软件示例表现出更高的韧性,明显优于非平滑分类器和基于随机化平滑的分类器。
Feb, 2024