CVPRJun, 2021

数据增强以提高图像字幕生成解决方案的鲁棒性

TL;DR该论文研究了运动模糊在图像描述中的影响,通过在训练中增加数据,在目标检测和描述两个阶段中都加入数据增强技术,成功地改进了解决方案的鲁棒性,特别是在高度运动模糊的情况下使 CIDEr-D 降低到了 11.7。