- ADS_UNet:一个用于组织病理学图像分割的嵌套 UNet
本文提出了 ADS UNet 算法,通过阶段性的增量式训练实现对浅层网络的高效深度监督,并对子 UNet 模型进行性能加权组合,以降低特征之间的相关性并提高分割性能,成功地在三个组织切片数据集中超越基于 Transformer 的最先进模型 - 组尺度旋转等变 UNet 用于组织病理学图像分割
本论文提出了基于尺度空间理论的比例等变 UNet(SEUNet)进行数字组织病理学图像分割,实验结果表明该方法在训练参数更少的情况下优于其他方法。
- Video-SwinUNet:VFSS 实例分割的时空深度学习框架
本文提出了一个基于深度学习的医学视频分割框架,通过时间特征融合和 Swin Transformer 编码强大的全局空时特征以及使用 UNet 编码解码结构,实现了在 VFSS2022 数据集上分割性能显著优于其他方法的效果。
- 递归提示的图像转树
本文提出了一种新颖的自动预测树形结构连接性的方法,使用 UNet 和 Transformer 结构的两阶段模型和基于图像提示的技术,有效地解决了在三维解剖数据中存在 2D 投影中的覆盖分支等问题,取得了优于最短路径基线的结果。
- KDDMRF-UNets: 基于马尔科夫随机场的 UNet 搜索
本文提出了一种基于马尔可夫随机场的神经架构搜索方法 MRF-NAS,利用该方法结合 UNet 结构设计出了 MRF-UNet 网络用于数据的语义分割,实验结果表明,MRF-UNet 在多个数据集上均有显著的优势且计算成本较低。
- ECCV几何感知的单张图像人体整体光照调整
通过基于单图几何重建的框架实现针对人体的单张图片重照,在去除光照的同时,通过采用经过修改的 HRNet 和基于光线追踪的每像素灯光表示方法,恢复逼真的阴影,展现出包括硬阴影在内的高频阴影效果,优于先前的方法。
- 使用深度神经网络进行降水现在预报
本研究使用三种深度学习模型(U-net、ConvLSTM 和 SVG-LP)在二维降水图上进行降雨即时预测,并提出了补丁提取算法以获得高分辨率的降水地图和损失函数来解决图像模糊问题和减少降水地图中零值像素的影响。
- 静态图像中流体元素的可控动画
本文提出一种交互式控制静态图像中流体元素动画制作生成 cinemagraphs 的方法,通过允许用户提供方向、速度和蒙版等信息生成密集的光流图,进而使用生成对抗网络和 UNet 模型进行流畅的动画帧生成,取得了优于基线的质量和量化指标。
- IJCAI带有两个并行流的结构感知图像修复
本文介绍了一种基于 UNet 的双流终端到端架构,用于图像修复。其中,结构流辅助主流产生了合理结构和真实细节的结果。实验结果表明,该方法优于当前最先进的方法。
- 高效、高分辨率图像融合的空间分隔曲面渲染网络
本研究提出一种名为 S$^2$CRNet 的高效高分辨率图像和谐化神经网络,其使用空间分离的嵌入和曲线渲染模块来生成参数,并在合成图像和真实图像测试集上取得了最佳表现。
- ICCV用于前视声纳语义分割的海洋垃圾数据集
本研究利用前向扫描声纳(FLS)开发了一个新的海洋垃圾分割数据集,并使用各种编码器对其进行语义分割的基线结果进行了分析比较,其中最佳性能的模型为采用 ResNet34 骨干网络的 Unet,IoU 为 0.7481。
- KDD增强型注意力时空分割用于地物覆盖制图
本文介绍一种基于 UNet 结构,与双向 LSTM 和 Attention 机制相结合的创新架构,旨在共同利用卫星数据的时空性质,更好地识别各种土地覆盖的独特时间模式, 并将其用于全球多个地区的作物测绘。实验结果表明,该方法能够缓解噪声和识 - NBNet: 基于噪声基学习和子空间投影的图像去噪
本文介绍了 NBNet,这是一种新的图像去噪框架,该框架使用图像自适应的投影来减少噪声,并且通过学习一组特征空间中的重构基来区分训练网络,进而使用相应的信号子空间基和投影进行图像去噪和降噪。我们提出的 SSA 非局部子空间注意力模块也得到了 - ECCV使用反投影金字塔网络进行各种雾霾场景下的单张图像去雾
提出了一种名为 BPPNet 的背投影金字塔网络结构,其中包括多个复杂度级别的学习和多尺度结构信息,通过 UNet 和金字塔卷积块的迭代块合并构建生成器,并借助反向投影进行学习,使得该网络能够对密集雾和不均匀雾等各种具有挑战性的飘雾条件进行 - CVPR皮肤病变定位和分割的检测器 - 分割师网络
该研究提出了一种简单而新颖的基于卷积神经网络(CNN)的 “网络中的网络” 方法,用于分割皮肤病变。作者使用了一种名为 Faster RCNN 的方法进行预处理,配合 UNet 和 Hourglass 网络实现皮肤病变的分割。在 ISIC - UNet 3+: 医学影像分割的全尺度联通 UNet
本文提出了基于 UNet 的新型深度学习网络 UNet 3 + 进行医学图像语义分割任务,此方法在多尺度特征融合、深度监督等方面优化 UNet,通过增加全尺度 skip 连接和采用深度监督的方式获得更准确的分割结果,特别适用于器官在不同尺度 - IterNet: 利用血管网络结构冗余的视网膜图像分割
本文提出了一种名为 IterNet 的深度学习模型,基于 UNet,可用于视网膜血管分割,采用多个迭代的 mini-UNet,完全依赖于分割的血管图像本身来发现被遮盖的细节,无需预先训练。在 DRIVE、CHASE-DB1 和 STARE - CVPR在自然场景中检测任意形状文本的方法,改进文本识别
提出了一种基于流水线的文本识别框架 UHTA,其中包括用于检测的 UHT 和用于识别的 ASTER。在多个公共场景文本检测数据集上的实验结果表明,UHT 在检测自然场景图像中文本方面具有较好的性能和通用性。
- 基于 Unet-GAN 的医学图像分割领域偏移问题和供应商适配
本文提出了一种基于 Unet-GAN 的通用框架,通过无需注释的跨供应商训练和适应性学习来解决困扰医疗场景下声图图像分割问题的难题。
- 多细胞追踪的联合多帧检测和分割
本文介绍了一种利用 UNet 进行多细胞跟踪的方法,提出了一种检测和细胞分割相结合的解决方案来解决高密度细胞群分割难题,并提高了检测细胞有丝分裂的能力,实验结果表明其优于当前最先进的方法。