FLOAT: 改善多目标多部件场景分析的因式学习对象属性

CVPRMar, 2022

FLOAT: 改善多目标多部件场景分析的因式学习对象属性

FLOAT: Factorized Learning of Object Attributes for Improved Multi-object Multi-part Scene Parsing

Rishubh Singh, Pranav Gupta, Pradeep Shenoy, Ravikiran Sarvadevabhatla

TL;DR本文提出 FLOAT 框架，它是一个因式化的标签空间框架，可以有效地实现多对象和多部分图像场景的分割和语义分析。FLOAT 的独立密集预测对象和部分属性，减少了任务复杂度并提高了可扩展性，而推理时的 “缩放” 细化技术可以显著提高细分质量。与现有技术相比，FLOAT 在 Pascal-Part-58、Pascal-Part-108 数据集上，分别实现了 2.0%、2.1% 的 mIOU 和 4.8%、3.9% 的 sqIOU 的绝对提升。我们使用 Pascal-Part 数据集来创建最全面和具有挑战性的数据集 Pascal-Part-201，并实现 8.6% 的 mIOU 和 7.5% 的 sqIOU 的改进，证明了 FLOAT 在对象和零件的多样性中的有效分割。

Abstract

multi-object multi-part scene parsing is a challenging task which requires detecting multiple object classes in a scene and segmenting the semant

multi-object multi-part semantic parts segmentation label space

发现论文，激发创造

增强乳腺癌分割和识别的多注意力集成深度学习框架

本研究提出了多注意力增强的深度学习框架，用于从超声图像中进行乳腺癌肿瘤的分类和分割，实验结果显示其在分割和分类任务上取得了优异的性能。

Jul, 2024

SegVG：将物体边界框转化为分割图像以进行视觉对齐

SegVG 是一种新颖的方法，通过将边界框级别的注释转化为分割信号，为视觉定位任务提供了像素级别的监督。通过多层多任务编码器 - 解码器，我们学习了回归查询和多个分割查询，以在每个解码层中通过回归和分割来定位目标。通过三重对齐模块来减少域间差异，该模块使用三重注意机制来更新查询、文本和视觉特征，从而提升了目标定位性能。在五个广泛使用的数据集上进行的大量实验证实了我们的卓越性能。

Jul, 2024

DCSM 2.0：深度条件形状模型用于高效数据分割

使用深度条件形状模型 2.0，结合边缘检测器和基于边缘图的隐式形状函数，在低数据环境中实现医学图像分割的高效率，从而提高数据利用率并取得了比基准方法更好的性能。

Jun, 2024

用于分割模型训练的下丘脑及其子区域的高分辨率分割

通过使用合成图像构建的标签图，我们提供了一个由高分辨率离体磁共振成像构成的数据集，该数据集可以用于开发使用合成数据的脑结构分割方法。

Jun, 2024

Hot-Distance：结合独热编码和有符号距离嵌入的分割

机器学习模型精度取决于所拟合的数据，因此在训练模型时最好使用尽可能多的数据。本文介绍 Hot-Distance，一种融合有符号边界距离预测强度与一热编码灵活性的新型分割目标，在离子束扫描电子显微术（FIB-SEM）中用于细胞亚结构分割，以增加可用的训练数据量。

Jun, 2024

研究说话人分谱的置信度估计方法

研究论文通过对扬声器判别系统的分析，探讨了生成对下游系统有竞争力且能够在置信度得分最低的部分区间内隔离约 30% 扬声器判别错误的多种方法。

Jun, 2024

2D 实时 MRI 中下颌骨髁突的三维轨迹提取

通过实时 MRI 提取颞下颌关节的轨迹，可以为临床评估颞下颌关节的位移、轨迹特征和对称性等临床相关参数提供足够准确的精度。

Jun, 2024

MAMA-MIA：一项大规模多中心乳腺癌 DCE-MRI 基准数据集及专家分割

为解决乳腺癌磁共振成像（MRI）中缺乏专家标注的挑战，本研究提出了 MAMA-MIA 数据集，包括 1506 个多中心动态增强 MRI 病例的专家标注的原发肿瘤和非团块性增强区域。研究使用深度学习模型自动进行分割，并由专家进行修正，最终得到专家标注，同时提供了 49 个协调的人口统计和临床变量，并提供了使用 DCE-MRI 全图和专家标注进行训练的 nnUNet 架构的预训练权重。该数据集旨在加速深度学习模型的发展和评估，并促进乳腺癌诊断和治疗规划的创新。

Jun, 2024

增强单层切片分割通过 3D 转 2D 非配对扫描蒸馏

本研究提出了一种新颖的 3D 到 2D 蒸馏框架，利用预训练的 3D 模型增强 2D 单层切片分割，并在 707 个受试者数据集上进行的实验证明，该方法能够改善单层多器官分割的性能，尤其在低数据量情况下表现出色。

Jun, 2024

了解开放词汇部分分割的多粒度

利用广义部分和物体级上下文来缓解精细部分通用化不足，并整合竞争性部分关系和注意力控制技术，以改善图像中歧义边界和代表性不足的部分，PartCLIPSeg 在各种数据集上表现出色，提供了精细的分割和对部分关系的高级理解。

Jun, 2024