Mar, 2020

去混淆化的图片字幕生成:一项因果回顾研究

TL;DR本文提出了一种基于因果推断的新颖视角:去混淆图像标题(DIC),给出了 DICv1.0 框架,并在 MS-COCO 数据集的 Karpathy 和在线分裂上展示了 DICv1.0 的改进:两个流行的标题模型分别达到了单模型的 130.7 CIDEr-D 和 128.4 c40 CIDEr-D,为图像标题提供了有前途的方向。