场景识别中的目标、属性和类别学习

Jul, 2022

场景识别中的目标、属性和类别学习

Scene Recognition with Objectness, Attribute and Category Learning

Ji Zhang, Jean-Paul Ainam, Li-hui Zhao, Wenai Song, Xin Wang

TL;DR本文旨在提高场景识别的准确性，通过提取对象包含的属性和分类标签信息，提出了一种多任务属性 - 场景识别（MASR）网络，采用部分监督注释策略大大降低了人工干预，从而实现了更高效的属性标注。实验结果表明，MASR 学习到了更具区分力的表示，与现有方法相比具有竞争力的识别性能。

Abstract

Scene classification has established itself as a challenging research problem. Compared to images of individual objects, scene images could be much more semantically complex and abstract. Their difference mainly lies in the level of granularity of recognition. Yet, image recognition serves as a key pillar for the good performance of →

scene recognition attribute category label contextual information partially supervised annotation

发现论文，激发创造

语义感知场景识别

该论文提出了一种基于多模式 CNN 的场景识别新方法，结合图像和上下文信息，通过注意力机制来强化学习和增强场景的辨别能力，实验证明该方法性能超过所有现有的先进方法，并显著减少了网络参数。

Sep, 2019

使用卷积神经网络的语义正则化场景分类器，通过物体理解场景类别

本研究利用深度学习技术提高了机器人应用中的场景分类能力，通过语义分割对深度神经网络进行正则化，实现了基于对象知识的场景分类，比目前最先进的算法在 SUN RGB-D 数据集中获得了更好的表现，同时使语义分割性能达到了新的记录，并将算法成功应用于移动机器人捕捉的图像场景分类中。

Sep, 2015

基于注意力机制的分类方法：利用先验知识进行场景图分类

本文研究了场景图分类中的多任务学习方法，将分类实现为一个注意力层，从而促进先前知识的传播并增强归纳偏差；引入外部知识可以进一步提高分类精度。

Nov, 2020

自动发现、关联估计和学习语义属性：千种类别

本文提出了一种端到端的无监督属性学习方法，利用在线文本语料库自动发现与人类概念语义属性相关的显著且有区分度的词汇，并针对文本中的噪声和缺失数据，提出了一个深度卷积模型来优化课程 - 属性关联。实验证明，该方法能够有效地在大规模数据集上发现和学习语义属性，并且在 ImageNet、Animals 较 Attributes 和 aPascal/aYahoo 三个数据集上优于现有技术的零样本学习效果。

Apr, 2017

利用场景和语义特征进行多模态情感识别

提出了一种利用场景和语义特征的多模态情绪识别方法，通过结合人物特征和环境上下文，使用 EmbraceNet 提取图像特征，并在 EMOTIC 数据集上验证了方法的有效性。

Aug, 2023

基于高效注意力的特征增强场景解析

本文提出了一种新颖的特征增强网络，通过从多个特征提取级别收集空间上下文，并计算每个表示级别的注意力权重以生成最终的类别标签。该模型还学习了低分辨率下的空间上下文信息以保留场景元素之间的抽象空间关系并降低计算成本，最终的特征集合中融合了空间注意力特征，并在 ADE20K 和 Cityscapes 数据集上优于所有现有模型。

Feb, 2024

利用语义分割改善面部属性预测

本文提出了一种利用语义分割来优化面部属性预测的方法，通过这种方法，我们不仅能够识别人脸属性，而且能够定位这些属性，获得了比以前更好的结果。

Apr, 2017

语义嵌入相似性原型用于场景识别

本论文通过引入统计策略，利用类别级别的语义表示来探索场景内不同类别之间的关联，进而构建一个相似性原型，从梯度标签软化和批级对比损失的角度提出了两种使用相似性原型来支持网络训练的方法，对多个基准进行了全面评估，结果表明我们的相似性原型能够提高现有网络的性能而不增加计算负担。

Aug, 2023

室内场景识别的语义引导上下文建模

本文提出了一种基于语义分割的新方法 SpaCoNet，旨在同时模拟对象的空间关系和共现情况，进而在室内场景识别任务中生成语义引导的特征表示，该方法具有良好的通用性和效果。

May, 2023

用于属性改进的属性：属性分类的多任务网络

通过使用多任务深度卷积神经网络 (MCNN)，共享所有属性的最低层，共享相关属性的更高层，并在 MCNN 上构建辅助网络以利用所有属性的分数来提高每个属性的最终分类，我们可以利用属性关系来提高属性分类器的准确性。我们在两个具有挑战性的公开数据集上展示了我们方法的有效性。

Apr, 2016