- 基础分割模型的稳健性分析
本文通过性能评估研究了在分割任务中对真实世界分布偏移抗干扰能力的不同模型,发现 Visual Foundation Models(VFMs) 对基于压缩的破坏不具备鲁棒性,而非 VFM 模型在监督下表现更加强健,但在零样本评估中仍然竞争性鲁 - MM基于圆谐特征的多麦克风会议自动语音分割
本文提出了一种在远距离语音场景下解决语音分割任务,包括 VAD、OSD 和 SCD 的通用框架,使用 CH-DOA 提取的空间特征与标准声学特征相结合,实验证明可以提高分割效果,并且在停用麦克风的情况下仍然具有鲁棒性。
- 基于 Transformer 的视觉分割:一份综述
本文综述了基于 transformer 的视觉分割技术,总结了近期的进展,详细介绍了各种方法设计和应用,并对该领域的未来研究方向进行了探讨。
- 有限标注条件下的分割学习:MRI 自监督预训练中的回归和对比损失
本文研究了两种预训练方法(回归损失和对比损失)对深度学习模型在磁共振成像下的肝脏分割和前列腺分割应用中的效果,并发现自我监督预训练减少了标记数据的需求,且基于对比损失的预训练的初始化效果更好。
- CVPR使用地理空间注意力重新审视近 / 远距离感知
介绍了一种基于大地空间注意力机制的近 / 远距离感知方法,该方法结合了空中和地面图像的几何特征和外观,提高了分割任务的准确性。实验结果显示,该方法显著优于之前的最先进方法。
- 如何将深度视觉解释应用于时间序列
该研究提出了一个包含六个度量标准的框架,可以用于评估时间序列分类和分割任务中的可视化解释方法的可靠质量度量,并评估了多种流行神经网络架构在不同数据集上的表现,从而为领域专家提供选择适当可视化技术的建议。
- 限资源分割的循环 U-Net
该论文介绍了一种新颖的循环 U-Net 网络结构,它可以保留原始 U-Net 的紧凑性,并显著提高其性能,尤其在几个基准测试中超过了现有技术。该方法不仅适用于手部、视网膜血管和道路等多种分割任务,还引入了大规模手部分割数据集。
- 利用加权一致性目标的深度半监督分割
本文介绍了如何将 Mean Teacher 泛化到分割任务,并表明该方法可以在公开数据集中显着提高分割性能,同时解决了传统数据增强策略在分割任务中出现的问题。
- MM一种连续最大流算法解决一般的分层多标签问题
该论文提出了一种广义分层最大流 (GHMF) 分割算法,该算法可以在全局最优凸优化框架中将解剖学的部分 - 整体关系表现为非约束性分层,从而实现标签的空间分组和聚类,并适应于多种分割任务中。