Sep, 2023

Rank2Tell: 一种用于联合重要性排序和推理的多模态驾驶数据集

TL;DR基于黑盒人工智能模型,本研究介绍了一种新的多模态自我中心数据集 Rank2Tell,用于评估重要性等级和解释重要性的原因。通过各种视觉问题回答,该数据集提供了复杂交通场景中各种重要对象的密集注释,为研究视觉场景理解等相关领域的学者提供了宝贵资源。同时,我们引入了一种联合模型,用于联合评估重要性等级的排序和自然语言描述生成,以对我们的数据集进行定量评估。