深度视频编解码器控制

Aug, 2023

Deep Video Codec Control

Christoph Reich, Biplob Debnath, Deep Patel, Tim Prangemeier, Srimat Chakradhar

TL;DR本文提出了第一个同时考虑带宽限制和下游视觉性能的端到端可学习深度视频编解码器控制方法，通过在两种常见视觉任务和两个不同数据集上展示，我们的深度编解码器控制方法在满足动态带宽限制和遵循标准化的情况下，更好地保护了下游视觉性能。

Abstract

lossy video compression is commonly used when transmitting and storing video data. Unified video codecs (e.g., H.264 or H.265) remain the \emph{de facto} standard, despite the availability of advanced (neural) co

lossy video compression video codecs rate control modules deep video codec control downstream vision performance

发现论文，激发创造

基于深度学习的实时标准视频压缩质量控制技术在直播中的应用

基于实时深度学习的 H.264 控制器通过动态估算最优的编码器参数来维持视频质量，并在最小化压缩视频的平均比特率的同时实现高达 2.5 倍的带宽使用改善，且非符合概率低于 10^-2。

Nov, 2023

DVC：一种端到端的深度视频压缩框架

本文提出了一种基于深度学习模型的视频压缩方法，其中利用神经网络的非线性表征能力和学习基于光流估计获取运动信息并重构当前帧的方法，同时采用两个 auto-encoder 风格的神经网络来压缩相应的运动和残差信息以共同优化所有组件，并通过单一损失函数来一起考虑减少压缩比特数和提高解码视频质量之间的权衡，实验证明该方法在 PSNR 方面优于广泛使用的 H.264 视频编码标准，在 MS-SSIM 方面甚至与最新的标准 H.265 相当。

Nov, 2018

基于深度学习的无线网络实时直播流速控制

提出了一种实时基于深度学习的 H.264 控制器，利用即时的信道质量数据和视频块动态估计最优的编码器参数，以保持编码视频的比特率略低于可用信道比特率，验证了该方法在视频质量上相较于最先进的自适应比特率视频流媒体有 10-20 dB 的改进，平均数据包丢失率低至 0.002。

Sep, 2023

标准图像和视频编解码器对深度视觉性能的视角

本文研究了在深度视觉模型中使用标准编解码器的影响，发现使用 JPEG 和 H.264 编码会显著降低各类视觉任务和模型的准确性，特别是在语义分割准确度上降低了超过 80％。与以往研究不同的是，我们的分析扩展到图像和动作分类以外的领域，提供了更全面的观点。

Apr, 2024

学习型视频压缩

我们提出了一种 ML-based 的视频编码算法，通过评估不同分辨率和基于商业编解码器的标准视频压缩测试集发现，在低延迟模式下相对于 HEVC/H.265, AVC/H.264 和 VP9，我们的算法通常产生更小的代码。并且，我们的方法不会出现图块失真和像素化，可以产生更加视觉上令人愉悦的视频。

Nov, 2018

深度视频压缩的任务感知编码器控制

我们引入了一种创新的编码器控制器，它具有模式预测和图片组选择模块，通过在编码阶段集中控制，使得在不同任务中可以进行可调的编码器调整，同时保持与标准预训练深度视频压缩解码器的兼容性。实证数据表明，我们的方法适用于多个任务且适用于多个现有的预训练深度视频压缩解码器，而且广泛实验表明，我们的方法对于不同任务的比特率优于以前的深度视频压缩方法，仅需一个预训练解码器。

Apr, 2024

面向人类和机器的学习式可扩展视频编码

我们提出了一种全新的视频编码系统，基于条件编码的概念构建，其基础层支持机器视觉任务，而其增强层支持人类视觉重建，实验证明在基础层上，我们的框架优于现有的学习型视频编码和传统视频编码，并且在增强层上有可比性的性能。

Jul, 2023

端到端速率失真优化的学习式分层双向视频压缩

本研究提出了一种基于学习的分层双向视频编解码器，结合分层运动预测和端到端优化，实现了目前为止在 PSNR 和 MS-SSIM 上报告的学习视频压缩方案的最佳 R-D 结果，相对于传统视频编解码器，在 PSNR 和 MS-SSIM 以及 HM16.23 参考软件的 MS-SSIM 上性能均优于 x265 和 SVT-HEVC 编码器的 R-D 性能。

Dec, 2021

深度生成式视频压缩

文章提出了一种基于深度生成模型和序列数据的变分自编码器模型，用于视频压缩，经测试取得了竞争性的压缩效果。

Oct, 2018

分布式编码架构的低复杂度深度视频压缩

论文提出了一种基于深度学习的分布式视频编码架构，通过在解码器中使用有效的辅助信息生成模块，成功利用帧间相关性以提高压缩效率，同时，在编码速度相同的情况下，研究结果优于传统的分布式编码和基于 H.264 标准的压缩方法。

Mar, 2023