纹理引导的深度特征编码
本文提出了一种可扩展的图像压缩方案,包括特征表示和纹理表示的基本层和增强层,其通过神经网络进行分析和深层特征重建,可以在视频监控应用中实现优秀的性能表现。而实验证明该框架可以在保证精度和失真率的情况下,比传统的图像压缩方案具有更好的性能。
Mar, 2019
本文介绍了一种层次生成式图像压缩模型,该模型支持多任务分析,通过学习感知图像压缩方法提供可压缩的紧凑表示,并实现高分辨率图像重建以及压缩率和感知性能的平衡。实验结果表明,该模型对于 RGB 基于方法可以降低 99.6% 的比特率并实现可比拟的分析结果。
Apr, 2023
本文提出了一种文字引导图像压缩的多模态机器学习方法,通过使用文本的语义信息来引导图像压缩,以实现更好的压缩性能,包括采用图像 - 文本注意力模块和改进的多模态语义一致性损失函数。实验证明,该方法能够在极低比特率下获得较好的视觉效果,并且即使与最先进的技术相比,其性能也可以相媲美或超越。
Apr, 2023
本论文旨在解决动态纹理和场景分类这两个问题,在提取特征方面使用深度学习的方法,即将一个经过训练的卷积神经网络作为中间特征提取器,进行空间和时间上的特征提取,从而实现优异的性能。
Feb, 2015
精细化图像分类任务中,由于不同子类别间视觉差异小、类内变化大,深度学习方法在解决该问题中取得了显著成功。本文提出一种融合方法,通过将全局纹理与局部基于图像块的信息相结合来解决精细化图像分类问题。我们的方法在人脸、皮肤病变、美食、海洋生物等八个数据集上使用四个标准的骨干 CNN 进行了测试,并在分类准确率上取得了优于现有方法显著的提升。
Aug, 2023
本文提出了一种基于深度学习的纹理编码网络 ——Deep-TEN,该网络集成了一种编码层,并通过端到端的学习框架直接学习词汇表和编码,支持多数据集联合训练,具有很好的纹理和物质识别性能。
Dec, 2016
本文介绍一种用于伪装物体检测的深度卷积神经网络,通过使用多个纹理感知优化模块来放大伪装物体和背景之间的微小纹理差异,其中纹理感知优化模块计算特征响应的协方差矩阵来提取纹理信息,采用亲和力损失和边缘一致性损失来分离伪装物体和背景之间的纹理,并通过实验结果验证了该方法的有效性。
Feb, 2021
本文提出了一种基于可描述纹理数据集的词汇表,用于描述常见的纹理模式,以及一些对应的图像识别技术,包括物体材质和纹理属性的实时识别,并通过将深度模型卷积层用作滤波器进行优化以获得卓越的性能。
Jul, 2015
提出了一种新颖的极端图像压缩框架,该框架将压缩 VAEs 和预训练的文本到图像扩散模型结合在一起,通过潜在特征引导压缩模块进行图像压缩并解码为内容变量,然后利用预训练的扩散模型进一步解码这些内容变量,实验结果表明在极低比特率下,该方法在视觉表现和图像保真度方面优于现有方法。
Apr, 2024
本文研究了使用深度神经网络对纹理特征重要的图像数据集进行分类的方法,并通过定义手工特征提取的 VC 维来证明手工特征提取是降低异常误差率的有效工具,同时得出了卷积神经网络、Dropout 网络和 Dropconnect 网络的 VC 维上限以及它们异常误差率的关系。此外,本文还利用内在维度概念验证了基于纹理的数据集比手写数字或其他目标识别数据集本质上更高维,因此更难以被神经网络粉碎,同时还从 n 维流形中计算出样本数据的相对对比度随向量空间维度趋于无限大而消失的规律。
May, 2016