Sep, 2023

通过语义基础解决视觉语言任务中目标提议评估的不匹配

TL;DR评估目标提议的有效性,通过仅针对由阈值筛选的注释子集进行评估,使用语义基础实现与图像字幕和人工注释的对齐,并比较当前在场景图生成基准中使用的检测器的性能对比。