BriefGPT.xyz
Ask
alpha
关键词
zero-shot image recognition
搜索结果 - 2
理解 CLIP 对图像压缩的脆弱性
通过分析 CLIP 模型的脆弱性,我们揭示了其中关于图像质量和压缩对零样本图像识别准确性影响的本质,并在 CIFAR-10 和 STL-10 数据集上进行了广泛评估,从而为改进 CLIP 和其他视觉语言模型的鲁棒性提供了基础。
PDF
7 months ago
对比视觉语言模型中的感知分组
本篇论文研究视觉 - 语言模型在理解图像中物体所在区域和组合视觉相关部分方面的表现,提出一种最小的修改方案,获得了先进的无监督分割结果和对冗余相关性的鲁棒性。
PDF
2 years ago
Prev
Next