Oct, 2021

多模态数据集:厌女、色情和恶性刻板印象

TL;DR本文报道了一个规模为 400M 的过滤了不良内容的图像 - alt 文本数据集,该数据集在生成大规模机器学习模型时可能存在的问题和潜在涉及的利益攸关者(包括 AI 社区、监管机构、政策制定者和数据主体)的问题。