图像恢复的简单基线
通过 Transformer 网络 Restorer,我们设计了一种综合有效的解决方案,能够在去雨、去雪、去雾、去模糊等多种图像修复任务中展现国际领先或可比较的性能,并且在推理时速度更快。
Jun, 2024
研究了基于骨架动作识别中如何提取骨架联结的区分特征所面临的问题,提出了一种基于图卷积网络的高效的 GCN 基线。通过提出的复合扩展策略,在 NTU RGB+D 60 和 120 数据集上,其 EfficientGCN-B4 基线性能超越其他 SOTA 模型,且模型规模更小、训练速度更快。
Jun, 2021
本文提出了一种轻量级网络,采用 Siamese Self-Attention Block (SSAB) 和 Skip-Channel Attention (SCA) 模块,提高了模型对全局信息的聚合能力,适用于高分辨率图像,并且基于对低光图像恢复过程的分析,提出了一个优于现有方法的二阶段框架,能够在保持最先进的恢复质量的同时,用最少的计算量恢复一张 UHD 4K 分辨率的图像。
Dec, 2023
本文提出了一种简单而有效的联合模型,用于图像和视频的感知质量评估。该模型应用了来自主干网络的一个全局特征,并结合一些训练技巧,其性能超过了当前最先进模型的基线。根据所提出的架构,我们发布了三个常见场景下的良好训练模型。这三个预训练模型可直接用于质量评估,也可进一步进行微调以获得更多的用户需求。
Nov, 2021
本文提出一种新的激活单元,与传统的 per-pixel 激活单元相比,该单元实现了可学习的带有空间连接的非线性函数,使神经网络能够捕捉更复杂的特征,从而在图像恢复问题中取得了极高的性能和效率。
Nov, 2017
对于使图像分类器对微小扰动具有稳健性的问题,本文通过开发对抗训练的首个可扩展规律分析了模型大小、数据集大小和合成数据质量对稳健性的影响,并提出了对进一步推动该领域的可行建议。
Apr, 2024
本研究旨在回顾各种最先进技术,探讨如何通过序列减少训练参数和使用像全局均值池化、深度卷积和挤压、模糊化池等技术进行分阶段训练来构建高效的深度卷积网络,并成功实现了在 MNIST 数据集上仅使用 1500 个参数达到 99.2% 的高准确度,并在 CIFAR-10 数据集上仅使用超过 140K 个参数达到了 86.01% 的高准确度。
May, 2022
StarSRGAN 是一种用于盲超分辨率任务的 GAN 模型,通过实验比较与 Real-ESRGAN,提供了新的最先进性能,MANIQA 和 AHIQ 度量方面大约提高了 10%;另外,StarSRGAN Lite 是一种紧凑版模型,提供了大约 7.5 倍更快的重建速度,但仍能保持近 90% 的图像质量,从而有助于未来研究中开发实时超分辨率体验。
Jul, 2023
我们提出了一种基于 Argoverse 的有效基准线方法,旨在利用用于 Motion Prediction 的最新技术,包括注意力机制和 GNNs,来生成可行的多模态轨迹,以较少的操作和参数实现与其他 SOTA 方法相当的准确性。
Sep, 2023