UAVSNet:一种基于编码器 - 解码器架构的无人机图像分割网络
本文提出了一种新的多任务、多阶段神经网络,能够在单次前向传递中同时处理语义分割和基于视觉的航拍图像地理定位两个问题,并在卫星图像中实现商用 GPS 级别的本地化精度以及在 Inria Aerial Image Labeling 数据集和 Massachusetts Buildings 数据集上达到领先水平的分割效果。
Apr, 2018
介绍并推广了 UAVid 数据集,即用于语义分割的无人机高分辨率影像数据集。该数据集采用斜视图拍摄,结合侧视和俯视角度,可为对象的识别提供更多信息,并提供了几种深度学习基线方法,其中提出的多尺度扩张网络效果最好。
Oct, 2018
自动驾驶汽车的语义分割是理解周围环境的关键技术。研究通过融合编码器 - 解码器和两通道架构,提出了空间助理编码器 - 解码器网络(SANet),并在设计中利用不同分辨率的特征提取和池化模块以优化特征提取和实现语义提取,最终在实时 CamVid 和 Cityscape 数据集上达到竞争性的结果。
Sep, 2023
本研究提出了一个小型、轻量级的深度神经网络 MAVNet,用于实时语义分割图像,可用于空中监视和检查任务,并提出了两个新颖的数据集来验证算法,并实现了离线和在线实验。
Apr, 2019
通过在 2D TransUNet 体系结构的基础上建立在最先进 nnU-Net 体系结构的基础上,充分探索 Transformers 在编码器和解码器设计中的潜力,我们引入了两个关键组件:1)一个从卷积神经网络(CNN)特征图中令图像块标记化的 Transformer 编码器,从而实现全局上下文的提取;2)一个自适应地利用候选区域和 U-Net 特征之间的交叉注意力进行候选区域的精炼的 Transformer 解码器。我们的研究发现,不同的医学任务受益于不同的体系结构设计。Transformer 编码器在多器官分割中表现出色,其中器官之间的关系至关重要。另一方面,Transformer 解码器在处理小而具有挑战性的分割目标(如肿瘤分割)方面更有益处。大量实验证明了将基于 Transformer 的编码器和解码器集成到 U 型医学图像分割体系结构中的巨大潜力。TransUNet 在各种医学应用中超越竞争对手。
Oct, 2023
本研究提出 UTNet,这是一种简单而强大的混合 Transformer 体系结构,它将 self-attention 集成到卷积神经网络中,以增强医学图像分割,通过在编码器和解码器中应用 self-attention 模块来捕捉不同尺度的长程依赖关系,并提出了一种有效的 self-attention 机制与相对位置编码,从而将 self-attention 操作的复杂度从 $O (n^2)$ 降低到约 $O (n)$。在多标签、多厂商的心脏磁共振成像队列上对 UTNet 进行了评估,所示分割性能优异,对抗最先进的方法表现出很好的鲁棒性,有望在其他医学图像分割中具有广泛的应用前景。
Jul, 2021
提出了一种无与伦比的基于相机的多 UAV 协同三维物体检测范式 UCDNet,通过显式利用 UAV 到地面的深度信息作为强先验,为更准确和可推广的特征映射提供参考。此外,设计了一种同质点几何一致性损失作为辅助自监督方法,直接影响特征映射模块,从而增强多视角感知的全局一致性。在 AeroCollab3D 和 CoPerception-UAVs 数据集上的实验结果表明,与基准方法相比,我们的方法分别提高了 4.7%和 10%的 mAP,证明了 UCDNet 的优越性。
Jun, 2024
这篇论文介绍了一种基于 Transformer 的自适应语义聚集方法,将部分作为图像中最具代表性的语义,并将部分级别的特征分解为所有补丁特征的自适应总和,以实现准确的无人机 - 卫星图像匹配。
Jan, 2024
本文提出了一种自对齐无监督网络来提取无人机视角下肖像系统中的细化特征,旨在解决操作难度大、需要困难的注释过程的问题,并在 UAV-VeID 数据集上实现了最佳的 ReID 效果。
Jan, 2022