CircleFormer:基于圆查询和注意力的全切片图像圆形核检测
本文提出了一种基于中心点的变换网络 ——CenterFormer,它使用查询嵌入来聚合中心候选点的特征向量,并设计了一种通过交叉注意力来融合多帧特征的方法。在 Waymo Open 数据集上,CenterFormer 在单个模型上实现了先进水平,取得了 73.7% 的验证集和 75.6% 的测试集 mAPH, 显著优于以前所有已发表的基于 CNN 和 transformer 的方法。
Sep, 2022
我们提出了一种称为加权圆融合(Weighted Circle Fusion,WCF)的简单方法,用于合并来自不同圆检测模型的预测。该方法利用每个建议的边界圆关联的置信分数生成平均圆,在医学图像中改进了目标检测的精度,并显著减少了误检,为病理图像分析领域的未来研究和应用提供了有希望的方向。
Jun, 2024
提出了一种在 3D 物体检测中通过 IoU 预测来解决 NMS 中准确性问题的方法,使用了 3D IoU-Net 进行特征学习和准确性预测,并通过 Corner Geometry Encoding 和 Attentive Corner Aggregation 模块提取几何信息并实现对预测角度的不变性,实验结果表明,该方法在 KITTI car detection benchmark 上达到了最先进水平。
Apr, 2020
CurveFormer++ 是一种基于 Transformer 的单阶段方法,不需要图像特征视图转换模块,直接从透视图像特征中推断出三维车道检测结果。
Feb, 2024
本文提出了一种称为 Dilated Transformer 的方法,该方法在全球和局部范围内交替捕捉成对的补丁关系进行自我关注。我们基于 Dilated Transformer 的设计构建了一种名为 D-Former 的 U 型编码器 - 解码器分层结构,用于 3D 医学图像分割。实验表明,我们的 D-Former 模型在低计算成本下,从头开始训练,优于各种有竞争力的基于 CNN 或 Transformer 的分割模型。
Jan, 2022
通过使用多阶段 CNN 特征注入的 Transformer 网络,我们提出了一种名为 CINFormer 的 UNet 结构,以实现表面缺陷分割。CINFormer 在编码器中采用了简单而有效的特征整合机制,将输入图像的多层级 CNN 特征注入到 Transformer 网络的不同阶段,以保持 CNN 捕捉详细特征的优点和 Transformer 压制背景噪音的优点,从而实现准确的缺陷检测。此外,CINFormer 通过引入 Top-K 自注意力模块,可以聚焦于与缺陷相关的更重要信息的标记,以进一步减少冗余背景的影响。通过在 DAGM 2007、磁砖和 NEU 等表面缺陷数据集上进行的大量实验证明,CINFormer 在缺陷检测方面达到了最先进的性能。
Sep, 2023
本文提出了一种新的 Affine-Consistent Transformer(AC-Former)方法,通过全局和局部子网络的协同训练,直接产生一个核位置序列;同时引入了 Adaptive Affine Transformer(AAT)模块,用于自动学习关键的空间变换方法,以提高模型的性能。实验证明,该方法在多个评估数据集上显著优于现有的先进算法。
Oct, 2023
本文提出了 CIoU loss 和 Cluster-NMS 以增强两个重要任务中的几何因素,进而提高了对象检测和实例分割的平均精度和平均召回,实验表明该方法在各种模型中均有效。
May, 2020
本研究提出了一种基于串联交叉 - 注意力网络(CCAN)的新型变压器体系结构,可有效处理大规模的组织病理学图像,取得了与当前最先进的注意力方法相媲美乃至更好的结果,并且是一种在低数据环境下效率高的分析方法。
May, 2023