基于关系嵌入的小样本分类
通过创新的关系表示学习方法,同时关注个体内在特征和图像补丁特征之间的关系,构建了一种轻量级的关系表示学习网络(RRL-Net),包括自动编码器、特征交互学习模块、多维全局到局部注意力机制以及基于注意力的轻量级特征提取网络。经过大量实验验证,该网络在多个公共数据集上取得了最先进的性能。
Mar, 2024
本文提出了一种基于全局相关模块和判别性嵌入损失的少样本医学图像分割方法,利用深度卷积神经网络高效准确地进行分割,取得了最新的实验成果。
Dec, 2020
本研究提出了一种新颖的基于注意力机制的关系网络,其包含两个关键模块和一个目标检测主干以实现场景图自动生成,并在 Visual Genome 数据集上进行了实验验证其有效性和优越性。
Nov, 2018
本文提出了一种基于嵌入空间规范化和数据增强的新模型,用于以少量标记数据学习新的关系模式,并避免对以前任务的重大遗忘,实验表明此方法在连续少样本关系学习任务中显著优于现有技术。
Mar, 2022
本文提出了一种改进场景图生成的方法,通过显式建模整个对象实例的相互依赖关系,设计了一种简单而有效的关系嵌入模块,使我们的模型能够联合表示所有相关对象之间的连接,而不是只关注单个对象。在基本 Faster R-CNN 的基础上使用它,我们的模型在 Visual Genome 基准测试上取得了最先进的结果。通过引入全局上下文编码模块和几何布局编码模块,我们进一步提高了性能。在广泛的消融研究中,我们验证了我们的最终模型 LinkNet 在场景图生成方面的效果。
Nov, 2018
远程感知图像的语义分割是远程感知图像解释中的重要问题。目前已经取得了显著的进展,虽然现有的深度神经网络方法在依赖大量训练数据方面存在问题。少样本远程感知语义分割旨在仅使用少量标注的目标类别支持图像从查询图像中学习分割目标对象。然而,现有的少样本学习方法主要集中在从支持图像中提取信息,未能有效解决地理对象外观和尺度的大差异。为了解决这些挑战,我们提出了一种自相关和交叉相关学习网络,用于少样本远程感知图像语义分割。我们的模型通过考虑支持图像和查询图像之间的自相关和交叉相关来增强泛化性能。为了进一步探索与查询图像的自相关性,我们提出采用经典的频谱方法,基于图像的基本视觉信息生成一个类别无关的分割掩模。在两个远程感知图像数据集上进行了大量实验,证明了我们的模型在少样本远程感知图像语义分割中的有效性和优越性。代码和模型可以在此 URL 中访问。
Sep, 2023
本研究提出了一种利用卷积神经网络和注意力机制解决多关系表示学习中多重关系语义连接问题的模型 ConvMR,我们使用 FB15k-237 和 WN18RR 数据集进行实验,结果表明该模型能够显著提高平均 Rank 和处理不常见实体的效率。
Oct, 2022
本文探讨了基于互联网图像和相关文本标签的图像搜索、标签搜索和图像注释等任务,采用典型相关分析(CCA)方法将视觉和文本特征映射到同一隐藏向量空间,在此基础上,引入了表示高级图像语义的第三个视图来训练三个视图的嵌入,并结合多种视觉特征进行训练,实现了高效的嵌入式检索。
Dec, 2012
该研究论文提出了基于注意力机制的特征嵌入方法,能有效地捕捉到三元组周边复杂和隐式的信息,并在多个数据集上相对于现有方法实现了显著的性能提升。
Jun, 2019