基于一次学习的物体关系检测
本研究提出一种基于对象关系模块的深度学习模型,可以同时处理对象之间的外观特征和几何关系,从而提高了对象识别和重复去除步骤,在 CNN-based detection 中显著地有效,且无需额外 supervision,是第一个完全端到端的物体检测器。
Nov, 2017
通过使用关系信息,将粗略的目标检测器(例如 "桌子"、"台灯")转化为细粒度检测器(例如 "桌上台灯"),即使只有少量细粒度注释数据(全数据集的 0.2%),该方法也可达到接近基于微调的最新目标检测器水平,并在无见数据集(零 - shot transfer)上表现得更优秀。
Dec, 2022
本研究提出了一种自然语言引导的框架来解决视觉关系检测任务中对象对之间关系分类的问题,并使用双向循环神经网络以及语义连接来预测参与关系的对象之间的语义连接。该方法在 Visual Relationship Detection 和 Visual Genome 数据集上取得了最佳状态,特别是在未预测关系的情况下。
Nov, 2017
本文提出了用于同时识别和定位未见过类别的物体实例的 Zero-Shot Detection 问题,并引入基于 ILSVRC 数据集的新实验协议和元类概念来改善自动推导的语义描述的噪音,旨在在视觉和语义领域信息之间建立协同作用的新型 'Zero-Shot Detection' 深度神经网络。
Mar, 2018
该研究提出了一种基于逻辑引导的语义表示学习模型,通过知识图谱嵌入和逻辑规则,在已知和未知关系之间建立联系,用于零样本关系分类。实验结果表明,该方法可以推广到未见关系类型,并取得了有希望的提升。
Oct, 2020
通过因果推断进行对象关系预测的场景图生成方法,结合对象增强模块,在 Visual Gnome 150 数据集上取得了有效的实验结果,为决策模型的基础建模提供了巨大潜力。
Oct, 2023
本研究提出一种基于图结构推理的对象检测算法,同时考虑了对象的视觉外观、场景语境以及对象之间的关系,并将其视为认知和推理问题,通过实验表明,这种方法确实可以提高对象检测的性能。
Jun, 2018
本研究提出了一种新的模型,使用语义词嵌入的语言先验知识进行训练,以预测图像中的多个视觉关系,同时将物体和谓词分别训练,并在图像中标定对象的位置,从而提高基于内容的图像检索的准确性。
Jul, 2016