Jun, 2024

SafeSora: 通过人类偏好数据集实现文本到视频生成的安全对齐

TL;DR为了减轻大规模视觉模型(LVMs)带来的有害输出的风险,我们引入了 SafeSora 数据集,促进文本到视频生成与人类价值观的对齐研究。该数据集包括帮助性和无害性两个主要维度上的人类偏好,并进一步细分为 4 个子维度和 12 个子类别。通过多个应用,我们展示了 SafeSora 数据集的实用性,例如培训文本 - 视频审查模型、通过对齐算法的微调来与人类偏好相对齐的 LVMs 等。这些应用突显了 SafeSora 数据集在文本到视频对齐研究中的潜力,例如人类偏好建模和对齐算法的开发与验证。