Sep, 2023

NICE 2023 零 - shot 图像标题挑战

TL;DRNICE 项目是挑战计算机视觉社区发展准确性和公平性都达到最新水平的强大图像字幕模型,通过测试使用一个包含多个领域的大量可视化概念的新评估数据集,没有提供特定的训练数据,要求适应在训练过程中没有见过的新型图像描述。该报告包括 NICE 数据集、评价方法、挑战结果和前列参赛作品的技术细节,预期挑战的结果将促进 AI 模型在各种视觉语言任务上的改进。