CVPRDec, 2022

MetaCLUE: 全面的视觉隐喻研究

TL;DR本文介绍了 MetaCLUE—— 一组用于视觉隐喻的视觉任务,以及收集的高质量且丰富的比喻注释数据集,并对基于注释的最先进视觉和语言模型进行了全面的分析,重点介绍了当前方法在视觉隐喻分类、定位、理解和生成方面的优势和弱点,旨在为开发具有类人创造力的 AI 系统迈出具体的一步。