Feb, 2024

文本到图像模型中的危害放大

TL;DR我们的研究论文使用形式化定义 “harm amplification”,并开发了量化伤害扩大的方法,旨在解决 Text-to-image 模型中的安全问题,并在实际部署场景中检验了不同方法的效果,包括伤害扩大对不同性别的差异影响。