Apr, 2024

从微调和量化中提高 LLM 的脆弱性

TL;DR大型语言模型在各个领域中得到了广泛应用,但是它们也面临不同类型的攻击,如越狱、提示注入和隐私泄露攻击。本研究探讨了下游任务(如改进性调整和量化)对大型语言模型的脆弱性的影响,并展示了使用外部防护措施以减少脆弱性的实用性。