本文提出了一种使用 JPEG 图像的 DCT 系数作为输入的 CNN 解决方案来检测双 JPEG 压缩的方法,并且相对于以往方法具备端到端的检测能力。
Oct, 2017
通过评估解码和传递图像的计算成本,本文提出了适用于频域的深度模型的手工制作和数据驱动技术,以降低计算复杂性和参数数量,使其与 RGB 基线模型相似,从而实现计算成本和准确性之间的更好权衡。
Sep, 2023
应用深度学习的方法解决在损失图像和视频压缩中提高视觉质量的问题,通过训练一个特定的卷积神经网络,实现对图像语义的理解,并通过对每个对象训练特征的方式生成高质量的压缩图像。
Dec, 2016
本研究开发了一种基于人类视觉和深层神经网络架构的图像压缩框架 DeepN-JPEG 来降低智能物联网系统中数据存储和传输开销,并通过实验证明该方法能够在保持图像识别准确性的同时,实现高达 JPEG 的 3.5 倍的压缩率,具有在基于 DNN 智能物联网系统设计中提升存储和能量效率的巨大潜力。
Mar, 2018
该论文提出了使用 Motion aided Memory Network (MMNet) 进行快速目标检测的方法,并取得了较高的检测效果,验证了这种方法在压缩视频上的可行性。
Nov, 2018
本文研究图像压缩对图像分类、目标检测及语义分割等三种视觉识别任务准确性的影响。研究采用传统编解码器及最新的神经压缩方法进行实验,探究压缩比从 0.1 到 2bpp 下的识别准确度。实验发现,在强压缩下,三个任务的识别准确度都会受到显著影响。通过在压缩的训练图像上对识别模型进行微调,可以从一定程度上恢复性能损失。
Apr, 2023
本研究提出了一种名为 DWT-CompCNN 的基于深度学习的模型,使用高通量 JPEG 2000(HTJ2K)算法压缩文档,并从中提取离散小波系数,从而在压缩域中高效准确的对文档进行分类。实验表明该模型在时间和空间上的效率更高,而且能够取得更好的分类效果。
Jun, 2023
本文提出了一种在离散余弦变换(DCT)表示上执行语义分割的方法,通过重新排列 DCT 系数以形成首选输入类型,并针对 DCT 输入量调整现有网络来实现。该方法的准确性接近于 RGB 模型,在网络复杂性相当的情况下,适当选择 DCT 分量可以使用 36%的 DCT 系数获得相同水平的准确性,并且可以显示该方法的鲁棒性在量化误差下。据我们所知,这是第一篇探索 DCT 表示上的语义分割的论文。
Jul, 2019
本文提出了一种用于改善标准 JPEG 编码器的编码性能的学习方法,通过频域预编辑和同时学习 JPEG 量化表和预编辑神经网络可以有效改善 JPEG 的失真压缩性能。
Sep, 2020
本文提出了一种基于学习的压缩编解码器,来减少自动驾驶车辆数据的压缩解压缩带来的时延,并且还能用于对图像进行语义分割任务。
Jul, 2023