本文介绍一种有效的方法,通过聚合来自最相关的图像区域的上下文感知特征及其在区分细粒度类别中的重要性来捕获细微变化,避免边框和 / 或可见部分注释,并通过自我关注和图形神经网络的最新进展来包括一种简单而有效的关系感知特征变换及其在端到端学习过程中的性能评估。评估了我们的模型,发现其在八个细粒度对象和人类对象交互数据集上的识别准确性显著优于现有技术。
Sep, 2022
本论文提出了一种用于迭代视觉推理的新框架,该框架采用两个核心模块 —— 使用空间记忆存储先前信念的本地模块和全局图形推理模块。图形模块由知识图谱、当前图像的区域图和将区域分配给类别的分配图组成。实验表明,该框架性能强大,与普通 ConvNets 相比在 ADE 上能获得 8.4%的绝对提升,并且该框架对于推理中遗漏的区域具有韧性。
Mar, 2018
本文提出了一种基于图形关系推理网络方法 (GR2N) 的社交关系识别方法,该方法相比现有方法能够更快,更准确地构建社交关系图,并显式地抓住不同类型社交关系之间的强逻辑约束,从而提高社交关系图的性能。
Jul, 2020
本文提出了一种基于 gated relation network 的卷积神经网络模型,用于更好地捕捉词汇间的长期关联以用于命名实体识别,实验结果表明,该模型可以在 CoNLL2003 和 Ontonotes 5.0 数据集上实现最先进的性能。
Jul, 2019
本研究提出了一种基于多粒度推理的社交关系识别框架,包括全局知识,中层细节和细粒度姿态关键点。研究设计了基于姿态指导的人物对象图和人物姿态图来建模人物到对象的动作和配对人物之间的交互,并借助图卷积网络进行社交关系推理。实验结果表明提出的框架在两个公共数据集上具有较高的效果。
Jan, 2019
本文提出了一种基于图推理的转换器模型,通过引入关系推理模式来解决传统基于注意力机制的图像补丁交互中存在的问题,并在计算效率和相对于现有转换器基线的性能表现上实现了显著提高。
该研究提出了一种基于图神经网络和潜在空间的方法,以降低图的复杂度从而实现对视觉特征的非局部关联表示,并在三项主要的视觉识别任务上展示了其具有较高的性能和较低的计算成本。
May, 2019
本文提出了一种基于自然语言句子来生成图神经网络参数的方法(GP-GNNs),使 GNN 能够处理非结构化文本输入的关系推理,验证了在文本关系抽取中的有效性,并展示了我们的模型通过多跳关系推理可以发现更准确的关系。
Feb, 2019
本文提出一种改进的拉普拉斯算子将图形卷积引入语义分割任务中,并在特征空间中直接执行图形推理,以保留空间关系,并从不同尺度探索多个远程上下文模式的空间金字塔,结果表明,该方法在减少计算和内存开销方面具有可比性
Mar, 2020
本文提出了一种基于关系推理图网络的新型统一任意形状文本检测方法,其中使用 CNN 和 GCN 构建创新的局部图模型将任意形状文本实例划分成一系列小矩形组件,通过深度的关系推理网络进行推理,实验表明该方法在公开数据集上具有最先进的性能。