Aug, 2019

来自弱标注照片的美学图像字幕生成

TL;DR本文介绍了如何通过使用基于网站提供的图片和嘈杂的评论的自动清洗策略创建一个用于美学图像标题生成的基准数据集(AVA-Captions)。同时,还介绍了一种概率的标题过滤方法,以及利用美学属性间的潜在关联性进行卷积神经网络(CNN)特征提取器的训练的策略。该策略是弱监督的,并可用于学习丰富的美学表示,无需昂贵的标注。最后,文章通过自动度量和主观评价展示了所提出贡献的全面分析。