压缩 JPEG 图像中的快速目标检测

Apr, 2019

Fast object detection in compressed JPEG Images

Benjamin Deguerre, Clément Chatelain, Gilles Gasso

TL;DR该论文介绍了一种基于 JPEG 压缩格式中的 DCT 系数处理的对象检测快速深层网络，以代替一些应用中需要耗时的图像解压缩操作，实验结果显示该模型比常规 SSD 快 2 倍且具有良好的检测性能。

Abstract

object detection in still images has drawn a lot of attention over past few years, and with the advent of deep learning impressive performances have been achieved with numerous industrial applications. Most of th

object detection deep learning jpeg compression dct coefficients ssd

发现论文，激发创造

一种用于检测双重 JPEG 压缩的多分支卷积神经网络

本文提出了一种使用 JPEG 图像的 DCT 系数作为输入的 CNN 解决方案来检测双 JPEG 压缩的方法，并且相对于以往方法具备端到端的检测能力。

Oct, 2017

卷积神经网络用于 JPEG 图像：计算成本研究

通过评估解码和传递图像的计算成本，本文提出了适用于频域的深度模型的手工制作和数据驱动技术，以降低计算复杂性和参数数量，使其与 RGB 基线模型相似，从而实现计算成本和准确性之间的更好权衡。

Sep, 2023

使用深度卷积网络的语义感知图像压缩

应用深度学习的方法解决在损失图像和视频压缩中提高视觉质量的问题，通过训练一个特定的卷积神经网络，实现对图像语义的理解，并通过对每个对象训练特征的方式生成高质量的压缩图像。

Dec, 2016

DeepN-JPEG：一种基于 JPEG 的深度神经网络有利的图像压缩框架

本研究开发了一种基于人类视觉和深层神经网络架构的图像压缩框架 DeepN-JPEG 来降低智能物联网系统中数据存储和传输开销，并通过实验证明该方法能够在保持图像识别准确性的同时，实现高达 JPEG 的 3.5 倍的压缩率，具有在基于 DNN 智能物联网系统设计中提升存储和能量效率的巨大潜力。

Mar, 2018

压缩视频中的快速目标检测

该论文提出了使用 Motion aided Memory Network (MMNet) 进行快速目标检测的方法，并取得了较高的检测效果，验证了这种方法在压缩视频上的可行性。

Nov, 2018

视觉识别模型对图像压缩是否具有鲁棒性？

本文研究图像压缩对图像分类、目标检测及语义分割等三种视觉识别任务准确性的影响。研究采用传统编解码器及最新的神经压缩方法进行实验，探究压缩比从 0.1 到 2bpp 下的识别准确度。实验发现，在强压缩下，三个任务的识别准确度都会受到显著影响。通过在压缩的训练图像上对识别模型进行微调，可以从一定程度上恢复性能损失。

Apr, 2023

DWT-CompCNN: 高吞吐量 JPEG2000 压缩文档的深度图像分类网络

本研究提出了一种名为 DWT-CompCNN 的基于深度学习的模型，使用高通量 JPEG 2000（HTJ2K）算法压缩文档，并从中提取离散小波系数，从而在压缩域中高效准确的对文档进行分类。实验表明该模型在时间和空间上的效率更高，而且能够取得更好的分类效果。

Jun, 2023

探索基于 DCT 表示的语义分割

本文提出了一种在离散余弦变换（DCT）表示上执行语义分割的方法，通过重新排列 DCT 系数以形成首选输入类型，并针对 DCT 输入量调整现有网络来实现。该方法的准确性接近于 RGB 模型，在网络复杂性相当的情况下，适当选择 DCT 分量可以使用 36％的 DCT 系数获得相同水平的准确性，并且可以显示该方法的鲁棒性在量化误差下。据我们所知，这是第一篇探索 DCT 表示上的语义分割的论文。

Jul, 2019

学习如何在不改变标准解码器的情况下改善图像压缩

本文提出了一种用于改善标准 JPEG 编码器的编码性能的学习方法，通过频域预编辑和同时学习 JPEG 量化表和预编辑神经网络可以有效改善 JPEG 的失真压缩性能。

Sep, 2020

利用图像的压缩学习表示进行语义分割

本文提出了一种基于学习的压缩编解码器，来减少自动驾驶车辆数据的压缩解压缩带来的时延，并且还能用于对图像进行语义分割任务。

Jul, 2023