DDT: 双分支变形 Transformer 图像去噪
通过利用较小的音频块作为输入,我们提出了一种名为 DPATD 的双相音频变压器模型,该模型组织了一个深层结构的变压器层以学习用于降噪的清洁音频序列。广泛的实验证明我们的模型优于现有技术方法。
Oct, 2023
基于重建模型的适应动态邻居蒙版及 Transformer 和 Denoising Diffusion Model 的相结合的新框架 DDMT,在多元时间序列异常检测方面取得了具有先进性的结果。
Oct, 2023
本文提出了一种名为 Deep Descriptor Transforming (DDT) 的方法,通过对前馈模型的卷积层输出进行研究,实现对共同物体的定位,从而提升图像共定位问题的效率和精度。实验结果表明,近期方法 DTT 相较于其他同类方法,有更高的鲁棒性和泛化能力。
May, 2017
本研究提出了一种有效的雨水去除方法,即双路径多尺度转换器(DPMformer),通过利用丰富的多尺度信息来实现高质量图像重建。实验证明,与其他最先进的方法相比,我们的方法表现出色。
May, 2024
提出了一种基于 CNN 和 Dual Transformer 的 hierarchical dual Transformer 方法(HDT-HDR)进行去除 LDR 图像中 ghosts 的 HDR 图像生成方法,该方法能够同时提取全局特征和局部特征,进行了大量实验验证其效果优于现有的 HDR ghost removal 方法。
Apr, 2023
本文提出了一种新颖高效的 CNN 框架,结合 MD 模块和多分支 U 形结构,获得了与 Transformer-based methods 相当的全局上下文特征表征,用于图像去噪,实验结果表明模型 SUMD 可在各种数据集上产生可比较的视觉质量和准确性结果。
Apr, 2022
我们提出了一种紧凑的编码器 - 解码器 Transformer 模型 DeblurDiNAT,旨在高效地从现实世界的模糊图像中恢复清晰图像。通过采用交替的空洞因子结构和通道调制的自注意力块 (CMSA),以及快速特征传播的径路和乘法前馈网络 (DMFN),并使用轻量级的门控特征融合 (LGFF) 模块,我们在多个图像去模糊数据集上取得了最先进的性能。相比最近的竞争者,我们的方法在参数数量减少 3%-68%、可节省时间的同时,产生了更接近真实图像的去模糊结果。
Mar, 2024
Deformable DETR 提出了一种改进的 Transformer 注意力模块,只关注于围绕参考点的一小集采样点,能够更好地实现物体检测,尤其是在小物体上,并在 COCO 基准测试上得到了有效的实验结果。
Oct, 2020
该研究介绍了基于递归本地窗口自注意力结构的残差连接的递归变压器 (DRT) 的使用,该模型在低级计算机视觉任务的执行过程中需要少量的计算资源,而不需要有意地针对降雨设计;实验证明,它也可用于其他图像恢复任务,且可以达到有竞争力的结果。
Apr, 2022
本文提出了一种基于扩散驱动变换器的视频人体网格复原框架 (DDT),能有效地提高运动平滑性和时间连续性,并且具有较高的效率和因果性,能够广泛应用于各种实际场景。
Mar, 2023