Jun, 2024

从描述丰富性到偏见:揭示生成图像标题丰富化的黑暗面

TL;DR通过比较标准格式的字幕和最近的生成式字幕增强过程,从“性别偏见”和“幻觉”两个方面展示了增强字幕存在的性别偏见和幻觉问题,进一步表明这些增强字幕的模型平均增加了30.9%的性别偏见和59.5%的幻觉,从而警示了使字幕变得更具描述性的趋势。