一种可传递、自动调整的深度强化学习方法，用于成本效益高的网络钓鱼检测

Sep, 2022

一种可传递、自动调整的深度强化学习方法，用于成本效益高的网络钓鱼检测

A Transferable and Automatic Tuning of Deep Reinforcement Learning for Cost Effective Phishing Detection

Orel Lavie, Asaf Shabtai, Gilad Katz

TL;DR本文研究了使用增强学习来动态选择并加权选择多个学习模型的效果，在此基础上提出了优化和校准方法，并将其应用于安全策略的迁移，结果显示该方法具有高度的鲁棒性。

Abstract

Many challenging real-world problems require the deployment of ensembles multiple complementary learning models to reach acceptable performance levels. While effective, applying the entire ensemble to every sample is costly and often unnecessary. →

ensembles deep reinforcement learning fine-tuning calibrating security policies

发现论文，激发创造

深度强化学习在网络安全中的应用

本文综述了应用深度强化学习方法来解决网络安全领域中的复杂、动态和高维防御问题的 DRL 方法，并强调了 DRL 在网络物理系统，自主入侵检测和通过游戏模拟来应对网络攻击的策略防御方面的价值，同时也提出了对未来 DRL 网络安全研究发展的建议。

Jun, 2019

应对动态对抗性不确定性的网络系统防御中的深度强化学习

本文根据系统状态不确定性和攻防动态的特征，提出了一个数据驱动的 DRL 框架，学习上下文感知的防御措施，以动态适应不断变化的对抗行为，同时最大程度减少对网络系统运营的影响，在多阶段攻击和系统不确定性下，DRL 算法在积极的网络防御中具有很好的效果。

Feb, 2023

学习具有高成本特征的计算效率机器人

我们提出了一种通用的离线学习方法，其中考虑了输入特征的计算成本，通过将成本约束纳入到决策变换器的扩展中，从而在推断过程中限制其成本，使模型能够在每个时间步动态选择最佳输入特征。我们通过 D4RL 基准和类似于视频游戏中的复杂 3D 环境等多个任务展示了我们方法的有效性，并表明与传统方法相比，它能够在使用显著较少的计算资源的情况下实现类似的性能。

Aug, 2023

通过对抗攻击和训练的强大深度强化学习：一项综述

深度强化学习可以通过对抗训练提高其鲁棒性和可靠性，本研究对当代对抗性攻击方法进行了深入分析和分类，以提高深度强化学习代理的鲁棒性。

Mar, 2024

深度增强学习的深度攻击

通过强化学习实现攻击，在考虑攻击效果和匿名性的前提下，使用新的攻击性能指标对此方法进行评估，初步实验结果表明了该方法的有效性、鲁棒性和可转移性。

May, 2022

PDRL：基于多智能体强化学习的预测性监控

提出了一种新颖且通用的预测深度强化学习（PDRL）系统，用于监测复杂环境中的未来状态，并在时间序列预测过程中取得了最先进的性能。

Sep, 2023

DEFT: 快速转移强化学习的多样化集成

本文提出了基于 Deep Ensembles 的新方法 DEFT 来解决强化学习在高度多模态环境下的转移问题，在训练过程中加入一项鼓励策略之间不同的损失函数，产生多样性，最后将组件策略综合为新的适用于不同环境的策略。实验表明，该方法可以显著提高奖励并更快地收敛。