Sep, 2024

CoCA:通过宪法校准恢复多模态大型语言模型的安全意识

TL;DR本研究解决了多模态大型语言模型在面对恶意视觉输入时缺乏安全意识的问题。通过将安全要求的原则融入模型输入,提出了一种简单有效的技术CoCA,显著提升了模型的安全意识而不影响其原有能力。研究表明,CoCA能够帮助模型重新获得原始的安全意识,具有重要的潜在影响。