利用 Token Fusion 改进图像分类
本研究提出一种新的基于 Transformer 的图像融合方法,采用多尺度融合策略同时关注局部和全局信息,使用卷积神经网络与 Transformer 分支捕捉局部和长程特征,经对比实验表明,该方法优于当下多种融合算法。
Jul, 2021
通过整合转换器模型的多尺度融合策略,本研究提出了一种新的图像融合方法,以克服使用评价指标作为损失函数所带来的局限性,并改善了整体方法的效果。
Feb, 2024
本文介绍了用于医学图像分割的 TransFuse 并行网络结构,将 Transformers 和 CNNs 并置,以有效地捕捉全局依赖关系和低级别空间细节,且使用了一种新的特征融合方法 —BiFusion 模块来融合两个分支的多级特征。实验结果表明,TransFuse 在医学图像分割任务中的性能优于目前最先进的技术,同时在参数数量和推断速度上也有显著改进。
Feb, 2021
本文提出了一个针对基于 Transformer 的视觉任务的多模态令牌融合方法(TokenFusion),可以在保持单模态 Transformer 结构基本不变的同时,学习多模态特征之间的相关性,并超越三个典型视觉任务中的最先进方法。
Apr, 2022
通过融合 transformers 和 CNNs,我们提出了一种混合架构用于医学图像分割,旨在克服 CNNs 在捕捉全局依赖性和局部空间细节方面的局限性。我们通过比较各种架构和配置,并进行多次实验来评估它们的有效性。
Jan, 2024
本文通过使用视觉 Transformer 在语义标记空间中密集地建模标记关系并减少卷积计算量,从而在 ImageNet top-1 和 LIP,COCO-stuff 图像分割测试上表现出了显着的优势。
Jun, 2020
该研究提出了一种结合了 CNN 和 transformer 的方法 ——TransMed,在多模态医学图像分类中取得了很好的性能,这一方法为医学图像分析任务开启了更多可能性。
Mar, 2021
将卷积神经网络和 Transformer 架构相结合,提出了一种先进的二维特征提取方法,利用平行编码器和通道注意模块实现更好的医学图像分割准确性。
Jan, 2024
本文提出了一种高效的并行 Transformer-CNN 混合块,用于将 CNN 的本地建模能力和 Transformer 的非本地建模能力相结合,以提高图像压缩模型的整体架构,并在熵估计模型和注意力模块方面取得了最新进展,实验结果表明,该方法在三个不同分辨率的数据集上均实现了具有创新性的率失真表现.
Mar, 2023
该论文介绍了一种使用 Transformer 模块在多个分辨率上有效合并局部和全局上下文关系的相机和 LiDAR 数据融合方法,并通过与两个具有长途路线和高密度交通的对抗基准的广泛实验证实了该方法的性能优势。与之前的方法相比,该方法在最具挑战性的基准测试中取得了显著更高的驾驶和违规得分,对于 Longest6 和 Town05 Long 基准测试,分别取得了 8% 和 19% 的提升。
Aug, 2023