水下图像的语义分割:数据集与基准测试
为了提高水下抓取效率,我们标记并建立了第一个真实场景的水下语义分割数据集 (DUT-USEG:DUT Underwater Segmentation Dataset),并基于此数据集提出了一个重点关注边界的半监督水下语义分割网络 (US-Net: Underwater Segmentation Network),通过设计伪标签生成器和检测子网,实现了水下物体与背景之间边界的精细学习,并改善了边缘区域的分割效果,实验表明该方法在 DUT-USEG 数据集中的三类动物物种 (海葵,海胆和海星) 上提高了 6.7%的性能,达到了最先进的结果。
Aug, 2021
本文通过对海底图像进行感知研究来评估现有算法在实际数据中的表现,并提出了一个海底图像增强基准 (UIEB) 数据集,包括 950 张真实图像以及涉及卷积神经网络的算法,以此来评估现有算法的性能和局限性。
Jan, 2019
通过引入数据集 DUO 和相应的基准,我们解决了测试集注释缺乏、数据集存在其他缺陷和没有统一基准等几个挑战,这可用于学术研究和实际工业应用中对 SOTAs(使用 MMDtection 框架)进行效率和准确率的指标评估,并使用 JETSON AGX XAVIER 来评估探测器速度以模拟机器人嵌入式环境。
Jun, 2021
本研究介绍了 CaveSeg,这是一种针对水下洞穴中 AUV 导航的语义分割和场景解析的视觉学习方法。通过准备全面的水下洞穴场景语义分割数据集,解决了标注有限的训练数据的问题。通过在美国、墨西哥和西班牙的洞穴系统上进行全面的基准分析,展示了 CaveSeg 可以基于深度视觉模型实现快速的水下洞穴场景解析,并开辟了自主水下洞穴探索和绘制地图的未来研究机会。
Sep, 2023
AquaSAM 是扩展 Segment Anything Model (SAM) 在水下图像上的成功的首次尝试,用于创建一种多功能的水下目标分割方法。通过对 SUIM 数据集进行自动标签分类和提取,以及通过简化微调方法,AquaSAM 在水下图像分割任务中表现优于默认的 SAM 模型,尤其是在珊瑚礁等难度较高的任务上,平均 Dice Similarity Coefficient (DSC) 提高 7.13%,平均 mIoU 提高 8.27%。
Aug, 2023
DeepFish 提出了一个大规模的、适用于多个计算机视觉任务的数据集,该数据集包含了约 40,000 张图像,覆盖了 20 个热带海洋环境的鱼类栖息地,并且收集了点级别和分割标签,可以用于鱼类数量的自动监测、位置的标识和大小的估计。该数据集可以作为一个测试基准,用于激励在这一具有挑战性的水下计算机视觉领域的进一步发展。
Aug, 2020
我们提出了一种在水下领域应用特定的 Segment Anything Model (USIS-SAM) 的水下显著实例分割架构,通过引入水下领域视觉提示和自动生成显著提示器,我们的方法在 USIS10K 数据集上取得了卓越性能。
Jun, 2024
该研究介绍了第一个公开可用的多模态感知数据集,针对自主海洋导航中的水中障碍物,以增强自主水面车辆的情境感知。该数据集包括了不同环境条件下遇到的各种物体,并旨在通过提供多模态、带注释的、自我的感知数据集来填补海洋机器人学研究的空白,以进行物体检测和分类。我们还展示了该数据集框架的适用性,使用已经取得成功的基于深度学习的开源感知算法。我们期望我们的数据集将有助于海洋自主管道和海洋机器人技术的发展。请注意,这是我们正在进行的研究的一篇进行性论文,我们计划通过未来的出版物来完整发布。
Apr, 2024
介绍并推广了 UAVid 数据集,即用于语义分割的无人机高分辨率影像数据集。该数据集采用斜视图拍摄,结合侧视和俯视角度,可为对象的识别提供更多信息,并提供了几种深度学习基线方法,其中提出的多尺度扩张网络效果最好。
Oct, 2018
利用变分自动编码器的半监督方法来检测水下无人潜水器收集的人工物体图像, 通过数据聚类和异常分数提取技术,能够大规模地识别感兴趣的物体的候选样本,并在未标记的数据集上实现了平均精度为 0.64 的识别
Jun, 2023