RefineNet: 高分辨率语义分割的多路径细化网络
使用基于 ResNet 的多路径细化 CNN 用于对象轮廓检测,利用高、中、低级别特征融合的方法进行网络训练,实现了边缘检测任务的最佳性能,最终在经过改进的 PASCAL-val 数据集上获得了 ODS 值 0.752,同时,在 BSDS500 数据集上进行微调,实现了 ODS 值 0.824,达到了当前领域的最优水平。
Apr, 2019
本文提出了一种基于残差网络的高性能语义图像分割方法,并对不同变体的完全卷积残差网络进行了评估,进一步提出了用低分辨率网络模拟高分辨率网络的方法,引入了在线启动方法以及在一些残差块上应用的传统退化法,取得了在 PASCAL VOC 2012 数据集和 Cityscapes 上最好的平均重叠联合 75 的性能表现。
Apr, 2016
本文提出了一种基于深度卷积神经网络的语义图像分割方法,使用标签精炼网络在多个分辨率上粗到精地预测分割标签,并在网络的多个阶段定义了损失函数以提供不同的监督信号。实验结果表明该模型可以有效地进行像素级密集标注。
Mar, 2017
本文考虑了有效和高效的语义图像分割问题,将一种强大的语义分割结构 RefineNet 适应为更紧凑的结构,通过减少参数数量和浮点操作数量,实现了两倍以上的模型缩小,并保持了性能水平,使最快模型的速度从 20 FPS 提高到 55 FPS,并在 PASCAL VOC 测试集上具有坚实的 81.1%的平均 iou 性能;我们还展示了我们的方法与轻量级分类网络的容易集成能力,并仅使用 3.3M 参数和 9.3B 浮点操作完成 PASCAL VOC 的 79.2%均值 iou。
Oct, 2018
我们介绍了 RefineNet,这是一种新颖的架构,旨在解决文本到图像转换系统中分辨率限制的问题。我们探讨了从文本描述生成高分辨率图像的挑战,重点关注详细准确性和计算效率之间的权衡。RefineNet 利用层次化 Transformer 结合渐进和条件改进技术,在生成详细、高质量图像方面优于现有模型。通过对多样数据集进行广泛实验,我们展示了 RefineNet 在清晰度和分辨率上的优势,特别适用于复杂图像类别如动物、植物和人脸。我们的工作不仅推动了图像到文本转换领域的发展,还为各种应用中高保真图像生成开辟了新的途径。
Dec, 2023
探索使用逐渐增加特征映射维度的方式,提高深度残差神经网络的泛化能力,并提出了一种新的残差单元,增强了其分类准确性;实验表明,与原始的残差网络相比,该网络结构具有更好的泛化能力。
Oct, 2016
提出了一种 ResNet-like 的网络结构,结合多尺度上下文信息和像素级精确度,使得在不需要额外处理步骤和预训练的情况下,可以在 Cityscapes 数据集上实现 71.8% 的交并比得分,以提高自动驾驶系统中的图像分割效果。
Nov, 2016
本研究提出了一种用于单幅图像超分辨率的高精度方法,利用 VGG-net 进行训练,使用 20 个卷积层避免过拟合,训练方法基于小滤波器,只学习残差,并使用极高的学习率。实验表明,该方法在精度上优于现有方法。
Nov, 2015
使用高分辨率图像分类和卷积超分辨率技术相结合的方法,提出了一种用于解决低分辨率图像细节问题的端到端的深度模型,并在 Stanford Cars 和 Caltech-UCSD Birds 200-2011 数据集上进行了广泛的实验,结果表明该模型在低分辨率图像中能更好地分类细分类别。
Mar, 2017