- AAAIDualVD:一种用于视觉对话中深度视觉理解的自适应双编码模型
该研究提出了一种新的模型来从视觉和语义两个角度描述图像,在多角度图像特征的基础上提出了特征选择框架,逐层适应性地捕捉问题相关信息,并在基准视觉对话数据集上取得了最先进的结果。更重要的是,通过可视化门控值,我们能够确定视觉和语义哪个模式在回答 - ImageGCN: 基于多关系图卷积网络的胸部 X 光疾病识别
这篇论文考虑建模图片之间的关系以生成更有信息量的图片表示,提出了 ImageGCN,一个端到端的图卷积网络框架,可用于归纳式多关系图片建模,并应用于胸部 X 光图像进行疾病识别的实验,得到了优于基线方法和可与最先进方法相媲美甚至更好的定位和 - 超网络功能图像表示
通过使用神经网络表示图像的功能性表征,可以使用超网络构建一个可以轻松进行各种连续操作的连续性图像表征,并将其应用于图像超分辨率问题。
- NIPS分层表示的特征变形
通过使用 Fisher 信息的层级图像表示,我们比较了视觉敏感度和各种图像表示之间的关系。我们发现 VGG16 的早期层比人类感知和一个训练基于人类评分的图像质量的 4 阶级卷积神经网络匹配度更高,简单的早期视觉处理模型比 CNN 或任何 - ECCV深度形状匹配
该研究将形状匹配视为度量学习,使用卷积神经网络进行实现,在将图像表示分解为边缘图像的生成和使用结构从运动流水线自动获取地标图像的边缘图像的过程中进行网络训练。该方法在域泛化,基于通用素描的图像检索或其精细分类等多个任务上得到了改进并实现了多 - 比赛核函数中的干扰
提出了两种方法来解决局部特征点干扰问题,即通过在聚合阶段包含一组描述符权重来平等地处理每个本地描述符的个体贡献,并在标准公共图像检索基准测试中进行实验证明对于短向量或中向量的图像搜索,这两种方法都比对象方法表现更好。
- 基于循环多任务神经网络的集成感知
探讨了深度神经网络能否学习到通用的图像表示,并提出一种名为 MultiNet 的新模型,在共享特征的基础上,通过在共同的表征中相互交互来整合各个任务的解决方案,实现了在标准基准测试中提高各个任务性能的目的。
- 两个基地的故事:用卷积框架施加局部 - 非局部正则化于图像块
该研究论文提出了一种图像表示方案,其中等价于使用局部和非局部 patches 刻画构建紧密的帧图像,并称其为卷积 framelets。分析该表示方案得出了高性能的 patch-based image inpainting 算法的新解释,并提 - NIPS使用受监督的卷积核网络进行端到端核学习
本文提出了一种基于多层核机的图像表示方法,并通过监督学习来调整核的形态。该方法构建了一种新的卷积神经网络,在一些深度学习数据集上取得了良好的分类表现,表明了该方法在图像相关任务中的应用价值。
- MM材料分类中 Fisher 向量内部分量之间的相关性探究
本文介绍了一种名为 Completed Fisher vector(CFV)的图像表示方法,相较于传统的 Fisher vector(FV),CFV 不仅能够描述局部特征的方差,还能够描述局部特征的相关性,从而提高了鉴别能力,实验结果表明, - ICLR深度卷积生成对抗网络的无监督表示学习
该论文提出深度卷积生成对抗网络(DCGANs)可以用于无监督学习,通过在各种图像数据集上的训练,证明了 DCGANs 能够学习从物体部分到场景的表示层次结构,并且可以用于一般图像表示。
- ICCVAttribute-Graph:一种基于图的图像排序方法
本文提出了一种新的图像表示法 —— 属性关系图 (Attribute-Graph),用于通过图像的局部和全局特征排名与给定查询图像的语义相似的图像。实验证明,将图像建模为属性关系图可提高排序性能。
- 卷积分层递归神经网络学习上下文依赖关系
该研究提出了一种基于深度卷积神经网络和分层递归神经网络的图像分类模型,以更好地编码图像区域之间的空间和比例依赖关系,从而取得了在四个具有挑战性的目标 / 场景图像分类基准测试中最先进的结果。
- ICLR基于线性短语的简单图像描述生成器
该文介绍了一种使用自然语言描述图像的算法,该算法结合了计算机视觉和自然语言处理。通过使用先前训练好的卷积神经网络生成的图像表示和用于描述它们的短语之间的度量,该纯双线性模型训练出能够生成描述语句的能力。同时,作者提出了一种简单的语言模型,该 - 深度神经激活的 Fisher Kernel
本文介绍了一种将传统的基于低级局部描述符的图像表示法和卷积神经网络的深度神经激活相结合的框架,提出了一种从预训练的 CNN 中提取公平数量的多尺度密集局部激活的有效方法,并通过改进的 Fisher kernel 框架聚合这些激活。实验证明, - 卷积层下的宝藏:交叉卷积层池化用于图像分类
本文介绍一种新技术 cross-convolutional-layer pooling,并探讨卷积层激活的图像表示方式在使用中的优点和不足,通过应用于四个流行的视觉分类任务,证明该方法具有可比较或显著更好的性能,而造成的计算成本要低得多。
- 稀疏编码在图像处理中的统计效率 (或者,一个 Gabor 王者归来)
通过分离图像的变异因子,我们提出了一种基于 Gabor-like 滤波器的模型,在学习过程中达到更高的统计效率和更好的压缩性能,仅使用单个字典元素就可以优于标准稀疏编码,较好地解决了传统稀疏编码过度冗余的问题。