May, 2024

CICA:零样本文档图像分类中的内容注入对齐

TL;DR我们在零样本学习(Zero-Shot Learning,ZSL)和广义零样本学习(Generalized Zero-Shot Learning,GZSL)的环境中提供了对文档图像分类进行全面分析的方法和评价,同时提出了适用于 RVL-CDIP 数据集的零样本划分和一个名为 CICA 的框架,该框架通过引入一种全新的 ' 内容模块 ',可以提升 CLIP 的零样本学习能力,我们的模块只增加了 CLIP 的 3.3% 参数,并将其 ZSL 的 Top-1 准确率提高了 6.7%,GZSL 的调和平均值提高了 24%,这项工作为零样本文档分类的未来研究指明了方向。