场景识别中的目标、属性和类别学习
该论文提出了一种基于多模式 CNN 的场景识别新方法,结合图像和上下文信息,通过注意力机制来强化学习和增强场景的辨别能力,实验证明该方法性能超过所有现有的先进方法,并显著减少了网络参数。
Sep, 2019
本研究利用深度学习技术提高了机器人应用中的场景分类能力,通过语义分割对深度神经网络进行正则化,实现了基于对象知识的场景分类,比目前最先进的算法在 SUN RGB-D 数据集中获得了更好的表现,同时使语义分割性能达到了新的记录,并将算法成功应用于移动机器人捕捉的图像场景分类中。
Sep, 2015
本文研究了场景图分类中的多任务学习方法,将分类实现为一个注意力层,从而促进先前知识的传播并增强归纳偏差;引入外部知识可以进一步提高分类精度。
Nov, 2020
本文提出了一种端到端的无监督属性学习方法,利用在线文本语料库自动发现与人类概念语义属性相关的显著且有区分度的词汇,并针对文本中的噪声和缺失数据,提出了一个深度卷积模型来优化课程 - 属性关联。 实验证明,该方法能够有效地在大规模数据集上发现和学习语义属性,并且在 ImageNet、Animals 较 Attributes 和 aPascal/aYahoo 三个数据集上优于现有技术的零样本学习效果。
Apr, 2017
提出了一种利用场景和语义特征的多模态情绪识别方法,通过结合人物特征和环境上下文,使用 EmbraceNet 提取图像特征,并在 EMOTIC 数据集上验证了方法的有效性。
Aug, 2023
本文提出了一种新颖的特征增强网络,通过从多个特征提取级别收集空间上下文,并计算每个表示级别的注意力权重以生成最终的类别标签。该模型还学习了低分辨率下的空间上下文信息以保留场景元素之间的抽象空间关系并降低计算成本,最终的特征集合中融合了空间注意力特征,并在 ADE20K 和 Cityscapes 数据集上优于所有现有模型。
Feb, 2024
本论文通过引入统计策略,利用类别级别的语义表示来探索场景内不同类别之间的关联,进而构建一个相似性原型,从梯度标签软化和批级对比损失的角度提出了两种使用相似性原型来支持网络训练的方法,对多个基准进行了全面评估,结果表明我们的相似性原型能够提高现有网络的性能而不增加计算负担。
Aug, 2023
本文提出了一种基于语义分割的新方法 SpaCoNet,旨在同时模拟对象的空间关系和共现情况,进而在室内场景识别任务中生成语义引导的特征表示,该方法具有良好的通用性和效果。
May, 2023
通过使用多任务深度卷积神经网络 (MCNN),共享所有属性的最低层,共享相关属性的更高层,并在 MCNN 上构建辅助网络以利用所有属性的分数来提高每个属性的最终分类,我们可以利用属性关系来提高属性分类器的准确性。我们在两个具有挑战性的公开数据集上展示了我们方法的有效性。
Apr, 2016