Oct, 2024

SAFREE:无训练且自适应的安全文本生成图像和视频的保护措施

TL;DR本研究针对现有文本生成图像和视频的安全性问题,提出了一种新的无训练方法SAFREE,能够在不改变模型权重的前提下,有效过滤有害内容,同时保持图像质量。SAFREE的自验证过滤机制和自适应重注意力机制确保了生成的内容在保留安全概念的同时,达到最先进的安全性性能。该方法展示了其在多种生成任务中的灵活性和广泛适用性。