Apr, 2024

基于扩散辅助的高逼真无线图像传输的联合源信道编码

TL;DR利用预训练的文本到图像扩散模型,提出了一种名为 DiffJSCC 的新框架,用于增强信道传输的图像的逼真度,通过利用空间和文本特征以及信道状态信息(如信噪比)对预先训练的稳定扩散模型进行微调,实验证明该方法在感知度量方面显著优于常规方法和以往的深度联合源信道编码方法,尤其在信道条件差和带宽有限的情况下表现出色,即使在 1dB 信噪比下,DiffJSCC 也能以每像素不到 0.008 个符号的速度对 768x512 像素的 Kodak 图像进行高度逼真的重建。