MuraNet:关系注意力的多任务平面图识别
本文提出了一种利用深度神经网络进行多任务学习的方法,设计了一种可以识别平面图中各种元素的模型,并使用空间上下文模块中的房间边界引导注意力机制,以增强模型的准确率。
Aug, 2019
本研究旨在通过多任务学习方式训练一个网络实现视觉注意力,使用半监督学习方式生成前 / 背景分割标签,进而训练目标检测模型,利用分割地图实现自我注意机制,获得在交通监控领域两个数据集上显著的 mAP 改进,UA-DETRAC 和 UAVDT 数据集上均实现了最先进的结果。
Feb, 2020
本文提出了一种新的多任务学习架构,其中包含了任务特定的特征级别的注意力学习,称之为 Multi-Task Attention Network (MTAN),它可以在任何前馈神经网络的基础上进行端到端训练,本文在图像分类任务和图像到图像预测上进行了验证,发现相对于现有方法,该架构达到了最先进的水平,而且对多任务损失函数的各种加权方案也不敏感。
Mar, 2018
本文介绍了一种基于 LiDAR 的多任务网络 LidarMultiNet,它将 LiDAR 的三个主要感知任务:3D 物体检测,语义分割和全景分割统一起来。通过使用全局上下文汇聚(GCP)模块提取全局上下文特征,任务特定的头被添加到网络的顶部执行三种任务。LidarMultiNet 在 Waymo Open Dataset 和 nuScenes 数据集 上进行了广泛的测试,表明主要 LiDAR 感知任务可以在单个强网络中统一,并在既有 API 上取得最佳结果。
Sep, 2022
本文提出了一种基于 Transformer 和 MPU-Net 的肿瘤分割模型,该模型结合了图像串行化和位置注意力模块,旨在理解更深层次上的上下文依赖关系和实现更准确的位置定位,并在肝脏肿瘤分割挑战中表现出优异的性能。
Jul, 2023
我们提出了一种新颖的技术,使用由单独的卷积自编码器生成的特征图在卷积神经网络中加入了注意力结构体系。我们在皮肤癌分割和肺部病变分割的基准数据集上评估了模型,并与 U-Net 及其残差变体进行对比,结果表明性能颇具竞争力。
Feb, 2019
采用引导自我关注机制的卷积神经网络模型对医学图像进行语义分割,能够更好地捕捉图像中的上下文依赖关系,去除冗余的信息提取并集成本地特征和全局依赖,强调相关特征关联,从而取得更好的分割效果。
Jun, 2019
本文提出了一种多路径编码器结构来提取多路径输入的特征,多路径注意力融合块模块来融合多路径特征,以及细化注意力融合块模块来融合高层抽象特征和低层空间特征。同时,提出了一种新的卷积神经网络架构,名为注意力融合网络 (AFNet)。基于该 AFNet,在 ISPRS Vaihingen 2D 数据集上达到了 91.7% 的整体精度和 90.96% 的平均 F1 分数,在 ISPRS Potsdam 2D 数据集上达到了 92.1% 的整体精度和 93.44% 的平均 F1 分数,取得了最先进的性能。
May, 2021
本文通过应用双重注意力网络 (DANet) 和自注意力机制来捕捉语境相关性,以实现更准确的场景分割,在 Cityscapes 数据集上取得了 81.5% 的平均 IoU 得分,并提供了相应的代码和训练模型。
Sep, 2018
本文提出了一种基于 3D 注意力的 U-Net 架构,用于使用由三个非本地 MRI 卷积组合而成的单一堆叠的多模态体积进行大脑肿瘤的多区域分割。该方法通过在 U-Net 的解码器端添加注意机制来提高分割精度,从而减少了对健康组织的侧重和突出了恶性组织,提高了泛化能力并减少了计算资源。该方法在 BraTS 2021 任务 1 数据集上进行训练和评估,证明其在精度上优于其他方法。实验结果表明,该方法潜在地提高了使用多模态 MRI 数据进行大脑肿瘤分割的能力,有望为更好地理解和诊断脑部疾病做出贡献。这项工作强调了在大脑肿瘤分割中结合多种成像模式和引入注意机制以提高精度的重要性。
May, 2023