Sep, 2024
NYK-MS:一个注释完善的多模态隐喻和讽刺理解基准在卡通字幕数据集上的应用
NYK-MS: A Well-annotated Multi-modal Metaphor and Sarcasm Understanding
Benchmark on Cartoon-Caption Dataset
TL;DR本研究针对现有多模态隐喻和讽刺理解任务中数据集缺乏的问题,提出了NYK-MS基准,包含1583个隐喻样本和1578个讽刺样本,并进行了多轮高质量标注。研究发现,尽管大型语言模型在分类任务中表现不佳,但随着模型规模的增加,其在理解隐喻和讽刺的其他任务中的表现有所提升,验证了基准与现有数据集的一致性。