Oct, 2023

利用语言模态的指导改进视觉异常检测

TL;DR该论文提出了跨模态引导(CMG)方法,通过跨模态熵减少(CMER)和跨模态线性嵌入(CMLE)来解决视觉模态中多余信息和稀疏空间的问题,实验证明该方法优于仅使用图像的基准方法 16.81%。