Jan, 2024

图像语义和语法序列学习导向

TL;DR通过引入 “图像语法” 的概念,结合卷积神经网络和视觉变换器,我们提出了一个两阶段的弱监督学习方法,利用深度聚类和特征细化生成部分 - 语义分割,并结合双向长短时记忆模块处理语义分割补丁序列以捕捉图像语法,实现了对图像补丁损坏的准确检测,在多种语义和句法损坏场景中,验证了我们的框架在 Celeb 和 SUNRGBD 数据集上能够实现 70% 到 90% 的语法验证准确度。