Dec, 2023

基于 StyleGAN 先验的可扩展人脸图像编码:朝向人机协作视觉压缩

TL;DR利用 StyleGAN 先验,本研究探讨了利用派生的分层表示构建有效的可伸缩编码范式以满足人和机器的需求。通过逐步学习三层编码分层语义表示,构建机器智能和人类视觉感知支持的渐进式范式,并通过分层可伸缩熵转换器降低层间冗余,达到高效压缩目标。通过多任务可扩展率失真目标对提议的方案进行联合优化,证实在面部图像压缩方面,该范式优于最新的可变视频编码 (VVC) 标准,提供了人机协同压缩方面的新见解。