Sep, 2022

一种可传递、自动调整的深度强化学习方法,用于成本效益高的网络钓鱼检测

TL;DR本文研究了使用增强学习来动态选择并加权选择多个学习模型的效果,在此基础上提出了优化和校准方法,并将其应用于安全策略的迁移,结果显示该方法具有高度的鲁棒性。