RankSeg：基于图像类别排名的自适应像素分类分割

ECCVMar, 2022

RankSeg：基于图像类别排名的自适应像素分类分割

RankSeg: Adaptive Pixel Classification with Image Category Ranking for Segmentation

Haodi He, Yuhui Yuan, Xiangyu Yue, Han Hu

TL;DR本文提出将分割任务分解为两个子问题：（i）图像级或视频级多标签分类和（ii）像素级排名自适应选定标签分类。

Abstract

The segmentation task has traditionally been formulated as a complete-label pixel classification task to predict a class for each pixel from a fixed number of predefined semantic categories shared by all images or videos. Yet, following this formulation, standard architectures will ine

segmentation multi-label classification pixel-level rank-adaptive classification image video

发现论文，激发创造

Gloss2Text: 使用 LLMs 和语义感知标签平滑的手语标记翻译

我们的研究通过利用预训练的大型语言模型（LLMs）、数据增强和新的标签平滑损失函数，在中间注释的视频中，专注于 Gloss2Text 翻译阶段，并在 PHOENIX Weather 2014T 数据集上的广泛实验和消融研究中取得了显著的性能提升，为手语翻译领域的研究和发展提供了有效的方法和有前景的方向。

Jul, 2024

DCSM 2.0：深度条件形状模型用于高效数据分割

使用深度条件形状模型 2.0，结合边缘检测器和基于边缘图的隐式形状函数，在低数据环境中实现医学图像分割的高效率，从而提高数据利用率并取得了比基准方法更好的性能。

Jun, 2024

用于分割模型训练的下丘脑及其子区域的高分辨率分割

通过使用合成图像构建的标签图，我们提供了一个由高分辨率离体磁共振成像构成的数据集，该数据集可以用于开发使用合成数据的脑结构分割方法。

Jun, 2024

Hot-Distance：结合独热编码和有符号距离嵌入的分割

机器学习模型精度取决于所拟合的数据，因此在训练模型时最好使用尽可能多的数据。本文介绍 Hot-Distance，一种融合有符号边界距离预测强度与一热编码灵活性的新型分割目标，在离子束扫描电子显微术（FIB-SEM）中用于细胞亚结构分割，以增加可用的训练数据量。

Jun, 2024

研究说话人分谱的置信度估计方法

研究论文通过对扬声器判别系统的分析，探讨了生成对下游系统有竞争力且能够在置信度得分最低的部分区间内隔离约 30% 扬声器判别错误的多种方法。

Jun, 2024

2D 实时 MRI 中下颌骨髁突的三维轨迹提取

通过实时 MRI 提取颞下颌关节的轨迹，可以为临床评估颞下颌关节的位移、轨迹特征和对称性等临床相关参数提供足够准确的精度。

Jun, 2024

CLIP 解码器：使用多模态 CLIP 对齐表示进行零样本多标签分类

多标签分类的零样本学习方法，通过引入 CLIP-Decoder 的多模态表示学习，在零样本多标签分类任务中表现出前沿结果，相较于现有方法在性能上提升了 3.9％，在广义零样本多标签分类任务中提升了近 2.3％。

Jun, 2024

MAMA-MIA：一项大规模多中心乳腺癌 DCE-MRI 基准数据集及专家分割

为解决乳腺癌磁共振成像（MRI）中缺乏专家标注的挑战，本研究提出了 MAMA-MIA 数据集，包括 1506 个多中心动态增强 MRI 病例的专家标注的原发肿瘤和非团块性增强区域。研究使用深度学习模型自动进行分割，并由专家进行修正，最终得到专家标注，同时提供了 49 个协调的人口统计和临床变量，并提供了使用 DCE-MRI 全图和专家标注进行训练的 nnUNet 架构的预训练权重。该数据集旨在加速深度学习模型的发展和评估，并促进乳腺癌诊断和治疗规划的创新。

Jun, 2024

增强单层切片分割通过 3D 转 2D 非配对扫描蒸馏

本研究提出了一种新颖的 3D 到 2D 蒸馏框架，利用预训练的 3D 模型增强 2D 单层切片分割，并在 707 个受试者数据集上进行的实验证明，该方法能够改善单层多器官分割的性能，尤其在低数据量情况下表现出色。

Jun, 2024

了解开放词汇部分分割的多粒度

利用广义部分和物体级上下文来缓解精细部分通用化不足，并整合竞争性部分关系和注意力控制技术，以改善图像中歧义边界和代表性不足的部分，PartCLIPSeg 在各种数据集上表现出色，提供了精细的分割和对部分关系的高级理解。

Jun, 2024