BriefGPT.xyz
Ask
alpha
关键词
adversarial and alignment training
搜索结果 - 1
从微调和量化中提高 LLM 的脆弱性
大型语言模型在各个领域中得到了广泛应用,但是它们也面临不同类型的攻击,如越狱、提示注入和隐私泄露攻击。本研究探讨了下游任务(如改进性调整和量化)对大型语言模型的脆弱性的影响,并展示了使用外部防护措施以减少脆弱性的实用性。
PDF
3 months ago
Prev
Next