Sep, 2022

安卓能否笑对电子羊? - 源自《纽约客》漫画比赛的幽默「理解」基准

TL;DR本文试图让 AI 模型 “展现出理解” 的《纽约客字幕比赛》中的多模态幽默,同时研究采用视觉与语言、或只采用语言作为输入的模型,并公开了包括图片的注释、实体、场景特殊之处和笑话解释的数据集和语料库。