Oct, 2024

ETA:评估后对齐视觉语言模型推理时的安全性

TL;DR本文针对现有视觉语言模型(VLM)在实际应用中的安全性挑战,提出了一种新颖的两阶段推理对齐框架(ETA)。该框架通过评估输入视觉内容和输出响应,增强多模态环境下的安全意识,并通过调整生成分布以确保生成结果更加无害和有帮助,实验证明其在安全性、有效性方面超越了现有方法。