Apr, 2025

MuSeD:用于社交媒体视频中性别歧视检测的多模态西班牙语数据集

TL;DR本研究解决了社交媒体视频中性别歧视内容检测的挑战,提出了一个新的多模态西班牙语数据集MuSeD,包含约11小时的TikTok和BitChute视频。研究创新性地提出了一种注释框架,并评估了多种大型语言模型在性别歧视检测任务中的表现。研究发现视觉信息在标注性别歧视内容中起着关键作用,但模型在隐性歧视的识别上表现不佳,突显了这一任务的复杂性。