- 基于众包昆虫图像的细粒度分类的计算机视觉算法性能
细粒度分类、物种识别、计算机视觉、深度卷积网络和视觉转换器是本论文的关键词。通过对 9 种算法进行详细评估,论文提供了对昆虫中的细粒度任务解决程度的全面理解,其中视觉转换器在推理速度和计算成本方面表现最佳,而局部性视觉转换器在性能和嵌入质量 - EcoSense: 边缘云协作下的岸边船只能效智能感知
提出了一种难度感知的边缘 - 云协同感知系统,用于检测岸边的海洋物体,该系统将任务分为物体定位和细粒度分类,并根据预估的难度将物体进行边缘或云内分类。该系统在广泛使用的海洋物体检测数据集上表现出卓越性能([email protected] +4.3%),在系统 - CVPR尺度解耦蒸馏
本文主要介绍了一种新的逻辑知识蒸馏方法,即基于比例分离的蒸馏方法(SDD),通过将全局逻辑输出解耦成多个局部逻辑输出,并建立相应的蒸馏管道,帮助学生模型挖掘和继承细粒度和明确的逻辑知识,从而提高其识别能力。这种方法尤其在细粒度分类任务中展现 - PEEB:基于部件的图像分类器与可解释与可编辑的语言瓶颈
基于 CLIP 的分类器依赖包含文本编码器已知的 {类别名称} 的提示。我们提出了 PEEB - 一种可解释和可编辑的分类器,用于从视觉部分的文本描述符提取类别名称并进行匹配,以计算分类的逻辑得分。在类别名称未知的零样本设置中,PEEB 的 - LDCA: 基于上下文增强的局部描述符的少样本学习
本研究提出了一种名为 “局部描述符上下文增强” 的新方法,通过利用自适应全局上下文增强模块,独特地将局部描素与全局理解之间的差距相互联系起来,从而确保对于每个局部特征都进行更大范围的视觉解释,以取得在细粒度分类任务上最高绝对改进率达 20% - 桌面人机交互的多模态手势识别数据集
手势识别是一种不可或缺的自然高效人机交互技术组成部分,特别是在桌面级应用中,可以显著提升人们的生产力。本研究建立了一个名为 GR4DHCI 的数据集,其独特之处在于其固有的自然性、直观性和多样性,其主要目的是作为开发桌面级便携应用的宝贵资源 - 联邦遥感目标细粒度分类:一种参数高效的框架
该研究提出了一种基于联邦学习的隐私保护细粒度遥感目标分类框架 (PRFL),该框架允许每个客户端学习全局和本地知识,以增强私有数据的局部表示,从而在统计异质性环境中提供高度定制的模型,并最小化通信开销,提高效率,同时确保令人满意的性能,从而 - BirdSAT:鸟类物种分类和地图绘制的跨视图对比遮蔽自动编码器
我们提出了一种元数据感知的自监督学习框架,可用于鸟类物种的细粒度分类和生态映射,通过对地面图像的元数据进行富集,我们的模型学习到了鸟类的细粒度和地理条件特征,表现出最先进的性能,并实现了跨模态的信息检索和物种分布图的创建。
- 基于精细特征的面部伪造深伪视频检测
本文提出了一种基于显示抑制背景噪声和学习多尺度可区分特征的方法,将人脸伪造检测问题归纳为细粒度分类问题,并在不同数据集和伪造技术的实验场景中实验证明了方法的优越性。
- PARTICLE: 粒子:细粒度识别的部分发现和对比学习
我们基于自监督学习开发了细粒度分类和分割任务的表示优化技术,通过识别部分特异变化改进了 fine-grained 分类,在卷积和视觉变换网络中聚类像素表示,利用部分中心化学习和对比在图像中对部分进行聚类,并在多个数据集上展示了在图像分类和部 - ICCVPDiscoNet:细粒度识别的语义一致性部分发现
通过使用图像级类别标签和鼓励部件具有判别性、紧凑性、相互区分性、等变性以及在部分图像中激活的先验,我们提出了 PDiscoNet 来发现物体的部件,并且通过适当的损失函数编码这些先验,获得比之前的方法更好的部件发现性能,而不需要额外的超参数 - MS-Net: 用于合成孔径雷达图像中飞机细粒度分类的多模态自监督网络
提出一个新颖的多模态自监督网络(MS-Net)用于合成孔径雷达(SAR)影像中飞机的细粒度分类,通过大量实验,证明了 MS-Net 在无标签情况下能够有效降低类似类型飞机的分类难度,对 SAR 影像中飞机的细粒度分类具有开创性意义。
- 简化的具体丢弃 -- 改进了对细粒度分类的属性掩码生成
通过简化采样和减少对大型小批量大小的依赖,本研究提出了一种解决方案来绕过计算不稳定性,产生更细致、更连贯的归因掩码,并利用所得到的归因掩码改善已训练模型的分类性能,无需进行额外的微调。
- 变形金刚和卷积模型在昆虫细粒度分类中的比较
在物种鉴定中,细粒度分类是一项具有挑战性的任务。本研究比较了利用转换器层和卷积层的两种深度学习算法在昆虫纲中的表现,发现混合模型在准确性上优于完全卷积模型和完全转换器模型,而完全转换器模型在推断速度上优于其他模型。
- OpenAL: 用于开放式病理图像分类的高效深度主动学习框架
本文提出一种解决在打标签样本池中既包含目标类和非目标类的情况下如何查询样本的问题的方法 ——OpenAL,并在细粒度分类病理图像的实验中表明其可以显著提高目标类样本的查询质量,达到比当前最先进的主动学习方法更高的性能。
- ACL对比自举用于标签细化
本文基于对粗粒度分类注释的 fine-grained 分类与粗细映射的方法,提出了一种基于轻量级对比聚类的自举方法,用于迭代地精炼 passage 标签,并在 NYT 和 20News 数据集上得到了较大幅度的性能提升。
- 自动扩展扩散的视觉数据集
本研究介绍了一种基于自然语言描述的图像增广方法(ALIA),通过大规模视觉模型与语言模型的结合,自动生成域名描述,实现对样本数据的增广。该算法有效提高了训练数据的多样性,经过测试在细粒度和复杂分类中表现良好。
- 使用半监督学习和视觉 Transformer 的细粒度分类迁移学习
本研究探讨了 Semi-ViT,一种使用半监督学习技术微调 ViT 模型的图像分类方法,该方法更适用于缺乏注释数据的情况,特别是在电子商务等领域。我们的研究发现,即使在有限的注释数据的情况下,Semi-ViT 的性能也优于传统卷积神经网络( - IXA/Cogcomp 参加 SemEval-2023 第 2 项任务:基于知识库的上下文增强的多语言命名实体识别
本文介绍了一种新的命名实体识别级联方法,它由三个步骤组成:首先在输入句子中识别候选实体,然后将每个候选实体链接到现有的知识库中,最后预测每个实体候选的细粒度类别。实验证明,外部知识库在准确分类细粒度和新兴实体方面具有重要意义,并且我们的系统 - CVPR基于知识引导的关系图的中国青铜鼎的多粒度考古学定年
本研究提出了一种基于深度学习技术和考古知识相结合的青铜器定年方法。通过建立一个大规模的青铜器图像数据集,采用多头分类器和知识引导关系图探索属性与时代关联。实验证明该方法在细粒度图像分类具有最先进表现,数据集和源代码已在附录资料中公开。