非模态追踪任意物体
我们研究的问题是不完全图像分割:预测包括可见和不可见(被遮挡)部分的完整对象分割掩膜。我们使用 3D 数据构建了一个自动管道来确定真实的部分遮挡对象的不完全真值分割掩膜,并通过两种架构变体探索了在野外处理不完全完成任务的方法。我们的方法在包括 COCOA 和我们的新 MP3D-Amodal 数据集在内的不完全分割数据集上取得了最新的最好性能。
Dec, 2023
提出一种名为 amodal panoptic segmentation 的任务,旨在同时预测 stuff 类可见区域的像素级别语义分割标签和 thing 类可见区域以及遮挡区域的实例分割标签。扩展两个基准数据集以便研究新任务,在公开可用的 KITTI-360-APS 和 BDD100K-APS 中提供像素级别的 amodal panoptic 分割标签。提出了 APSNet 模型,它显式地建模了遮挡物和被遮挡物的复杂关系。在两个基准测试上达到了最先进的性能。
Feb, 2022
我们的方法通过在物体边界框外使用其上下文来指导预训练的扩散修复模型,逐步扩展遮挡物体并修剪额外背景,从而克服了两个技术挑战,并在众多成功的修复情况中展现了改进的照片级修复结果。
Dec, 2023
本文探讨了利用贝叶斯模型解决神经网络中的物体分割模糊出界问题,通过利用对象的背景和形状作为先验知识来实现模型对训练任务标签的超出范围的推理,并通过应用异常值处理技术来推广到部分被遮挡的对象并预测其模态对象边界。
Oct, 2020
本文主要探讨了利用物体识别和大数据集来解决单景深图像中物体检测系统缺乏尺寸和深度数据的问题,并通过引入 amodal 边界框完成任务、建立类别特定的物体尺寸分布模型和利用场景识别技术进行焦距推测的方法,在实际场景中取得了一定的成果。
Sep, 2015
本文提出了一种无需预测提议、将 amodal mask 分配到不同层级、通过在每一层独立地进行 amodal 实例回归来预测交通参与者及其语义标签的 proposal-free 多标签多类别无缝分割网络,并采用共享骨干和不对称双解码器的 et 架构以及 amodal mask refiner,其在 BDD100K-APS 和 KITTI-360-APS 数据集上的测试表明超越了现有技术水平。
May, 2022
本文介绍了一种基于 Hierarchical Occlusion Modeling 方案的 Unseen Object Amodal Instance Segmentation(UOAIS)技术,可以检测出未被发现目标实例上的可见掩蔽、Amoldal 掩蔽和遮挡,并在三种基准测试环境中取得了最新的最佳表现,可用于机器人在拾取遮挡物品时。
Sep, 2021
通过引入 Amodal Optical Flow 来解决透明或被遮挡物体造成的光流估计挑战,将可见区域与被遮挡区域结合起来形成的多层级像素级运动场景,提出了 AmodalSynthDrive 数据集来帮助研究该任务,并提供了强基准、Amodal Flow Quality 度量和 AmodalFlowNet 模型作为解决该任务的初步尝试,并证明其在广泛实验中的易处理性和在诸如全景跟踪等下游任务中的实用性。
Nov, 2023