ECCVJul, 2022

重新思考数据增强对于强健的视觉问答的影响

TL;DR提出了一种基于知识蒸馏的数据增强方法 KDDAug,通过放宽合理图像 - 问题匹配的要求,并设计了一个知识蒸馏(KD)策略生成所有生成的图像 - 问题对的伪答案,从而增强图像的数据集,以提高视觉问答(VQA)模型的泛化性能。