BriefGPT.xyz
Ask
alpha
关键词
customizable detection rules
搜索结果 - 1
ShieldLM: 强化 LLM 为一致、可定制和可解释的安全检测器
该研究提出了一种基于大型语言模型的安全检测器 ShieldLM,它遵循通用的人类安全标准,支持可定制的检测规则,并提供其决策的解释。通过在包括 14,387 个查询 - 响应对的大型双语数据集上进行训练,研究表明,ShieldLM 在四个测
→
PDF
4 months ago
Prev
Next