Mar, 2025
CyberLLMInstruct:用于分析微调大语言模型安全性的新数据集
CyberLLMInstruct: A New Dataset for Analysing Safety of Fine-Tuned LLMs
Using Cyber Security Data
TL;DR本研究解决了大型语言模型在网络安全应用中引发的安全风险问题,通过开发名为CyberLLMInstruct的数据集,包含54,928个指令-响应对,用于常见的网络安全任务。我们发现,微调模型的安全性会降低,但在CyberMetric基准测试中仍能保持较高的准确率,强调了性能与安全之间的权衡以及进一步研究微调方法的重要性。