AAAIApr, 2021

FixMyPose:姿态矫正字幕与检索

TL;DR本文提出 a new captioning dataset named FixMyPose,为了避免 ML 偏见,维护了不同背景的不同人群的平衡,对于该数据集我们提出姿势校正字幕任务及其反向目标姿势检索任务,并引入针对该任务的新指标。我们的基线模型能够在现实图像上有良好表现,但在人类评估中仍有提高空间。