CVEGAN:一种视感启发的用于压缩视频增强的生成对抗网络
本文提出了一种适用于逐帧视频的感知式学习视频压缩 (Pervetual Learned Video Compression,PLVC) 方法,并首次提出了一种递归条件判别器,该方法可以在保留视频画质和压缩率同时,满足时域上的一致性,而且其性能远远好于现有的学习视频压缩算法及现有标准 HEVC HM 16.20。
Sep, 2021
本文提出了一种基于多层小波包变换的生成对抗网络(MW-GAN)方法,旨在增强压缩视频的感知质量,其中运动补偿与小波重构网络被用于恢复高频细节,实验结果表明了该方法的优越性。
Aug, 2020
通过使用新的结构正则化技术和多尺度的卷积滤波器,我们提出了 SEGAN 和 SU-Net 来增强 CS-MRI 图像的结构信息,实验结果表明其能够学习目标结构信息并取得了最先进的性能。
Feb, 2019
该研究通过提出 ESRGAN,改进了 SRGAN 的网络架构、对抗损失和感知损失三个关键部分。ESRGAN 获得了 PIRM2018-SR 挑战的第一名,并取得了比 SRGAN 更好的视觉质量和更真实、更自然的纹理。
Sep, 2018
VEEGAN 是一种新颖的自动编码器,它通过反转生成器的作用从数据到噪声的映射来解决 GAN 中的 mode collapse 问题,并针对噪声提供了新的自动编码器损失函数。它在合成和真实图像数据集中,相较于其他 GAN 变体,产生更逼真的样本并且抵制模式坍缩。
May, 2017
在这篇论文中,我们提出了一种名为 Recurrent Back-Projection Generative Adversarial Network (RBPGAN) 的视频超分辨率算法,旨在生成在保留空间细节的同时具有时间上连贯性的解决方案。RBPGAN 集成了两种最先进的模型,以在不降低视频生成准确性的同时获得最佳效果。模型的生成器受到了 RBPN 系统的启发,而鉴别器受到了 TecoGAN 的启发。我们还利用 Ping-Pong loss 来增加时间上的一致性。通过使用不同数据集进行定性和定量的实验,我们的贡献使得该模型在时间上具有一致的细节方面优于早期的研究成果。
Nov, 2023
该研究提出了 Enhanced Super-Resolution Generative Adversarial Network (ESRGAN) 模型,采用感知驱动的方式进行单幅图像超分辨率处理,引入了新颖的模块和噪声输入方法以进一步改善图像的感知质量和纹理特征。
Jan, 2020
本文提出了一种名为 VideoGAN 的生成对抗网络,用于跨不同域传输基于视频的数据,并通过对结肠镜数据的实验验证,表明我们的 VideoGAN 可以显著提高多中心数据集上结直肠息肉分割的精度,并可用于将图像从阴天转换为晴天的任务。
Apr, 2020
提出了一种混合循环视频着色方案,使用 VCGAN,通过全局特征提取器和占位符特征提取器增强连续性和时空一致性,在颜色鲜艳和图像连续性之间取得良好平衡,并在彩色视频质量和时空一致性方面比现有方法产生了更高质量的结果。
Apr, 2021
提出了一种新颖的 ECGAN 用于具有挑战性的语义图像合成任务,通过使用边缘作为中间表示,并采用注意力引导的边缘传输模块进行图像生成,设计了一个有效的模块来选择性地突出显示根据原始语义布局的类依赖特征图,通过对比学习方法和多尺度对比学习方法,强化了同一语义类别的像素嵌入生成更相似的图像内容,并利用多个输入语义布局的标记像素结构来明确地探索更多的语义关系。
Jul, 2023