Mar, 2024

如何根据需要自行决策:利用强化学习代理辅助培养 LLM 在网络安全游戏中成为专家

TL;DR本研究介绍了 SecurityBot,一种由事先训练好的 RL 智能引导的 LLM 智能体,用于支持网络安全操作,在提供行为准则的基础上使用协作机制和动态建议,实现了与 LLM 或 RL 单独相比显著的性能提升。