- MMR-Mamba: Mamba 与空间频率信息融合的多对比度 MRI 重建
通过 MMR-Mamba 框架中 Mamba 和空间频率信息融合,从辅助模态获取的信息,实现了多对比度 MRI 加速成像和高质量重建目标图像,通过创新的策略有效融合了空间和频率领域的特征,避免冗余信息的引入。
- 使用参数优化的多阶段图卷积网络和 Transformer 模型进行人类活动识别的特征融合
使用深度学习模型(如卷积神经网络和 Transformer)进行人类活动识别,研究表明特征融合对于改善活动识别系统的准确性和稳健性具有重要意义。使用 HuGaDB、PKU-MMD、LARa 和 TUG 数据集,PO-MS-GCN 和 Tra - MCSD:一个具有多样融合的高效语言模型
通过线性扩展和快速推理速度,MCSD 模型利用多渠道斜率和衰减(MCSD)块实现对特征的鲁棒表示,通过跨多样的时间感受野提取特征,并通过元素级融合多样的特征以增强细致的特征提取能力。此外,MCSD 块将推理过程表达为递归表示,大幅减少空间复 - 通过时间组对齐和融合的压缩视频质量提升
本论文提出了一种时序群组对齐和融合网络,通过利用帧之间的长短期相关性来提高压缩视频的质量。该网络包括内部组特征对齐模块、外部组特征融合模块和特征增强模块,通过选择与目标增强帧的时间距离来组成图片组,从而使图片组能够包含邻近帧的长期或短期相关 - 4DHands: 使用 Transformer 重建 4D 交互手势
通过 4DHands 方法,从单目输入中恢复互动手部网格及其相对运动,处理了自由手图像输入和两只手的位置关系的限制,并通过新颖的分词和特征融合策略提出了一种基于 Transformer 的架构。
- 基于相似度引导的多模态融合 Transformer 在社交媒体中的语义地点预测
利用相似度引导的多模态融合变压器 (SG-MFT) 来预测社交用户的语义位置,该方法通过使用预训练的大规模视觉 - 语言模型提取高质量特征表示,并引入了相似度引导的交互模块 (SIM) 以减轻异构性和噪声干扰,并且通过相似度感知的特征融合模 - 频率辅助蟒蛇用于遥感图像超分辨率
提出了一种用于处理大规模远程感知图像超分辨率的频率辅助 Mamba 框架,通过多级融合结构和可学习的缩放适配器实现了准确的特征融合,相比于现有方法具有更高的峰值信噪比和更低的内存消耗和计算复杂度。
- 基于广义广式模型和概率引导融合的多模态情感学习再探
在多模式对话中的多模式情感识别(MERC)领域,我们考虑了长距离上下文语义信息在特征分离阶段的提取以及特征融合阶段中模态之间语义信息的一致性最大化,提出了一种新方法 Broad Mamba,它通过广义学习系统在广空间中压缩情感表示,并设计了 - RFL-CDNet:基于更丰富特征学习的准确变化检测
利用更丰富的特征学习来提高变化检测性能,我们提出了一种名为 RFL-CDNet 的新型框架,该框架采用深度多重监督来增强中间表示,并设计了 C2FG 模块和 LF 模块来进一步改进特征学习和获得更具有区分性的特征表示。
- 医疗图像分割的多模态信息交互
通过引入创新的多模态信息交叉变换器(MicFormer),本研究在多模态图像任务中成功整合不同模态之间的相关信息,显著提高了分割性能,表明 MicFormer 在多模态图像任务中具有广泛的应用潜力。
- 融合短吻鳄的跨模态物体检测
本文研究通过对改进的 Mamba 与门控机制在隐藏状态空间中关联交叉模态特征,设计了一个融合 Mamba 块(FMB)来将交叉模态特征映射到隐藏状态空间进行交互,从而降低交叉模态特征的差异性并增强融合特征的表征一致性;通过在公共数据集上进行 - MambaDFuse: 利用 Mamba 构建的双阶段多模态图像融合模型
提出了一种基于 Mamba 的双相融合模型 (MambaDFuse),用于解决现有方法在多模态图像融合任务中提取特征和融合特征的效率问题,通过设计双级特征提取器和双相特征融合模块,实现了具有良好融合结果的图像重建,并在红外 - 可见光图像融 - 超越局部:集成骨干网络进行少样本分割
利用多个骨干网络在 PANet 中的特征融合可以提高在挑战性、数据稀缺环境中对全景分割方法的性能。
- 基于能量的带深度导引的域自适应分割
基于能量估计的跨域语义分割的自适应模型 (SMART) 利用自监督深度估计来获得任务自适应特征,并实现可靠的特征融合,通过能量评估方法提高深度引导的有效性。该框架包含能量估计特征融合 (EB2F) 和能量估计可靠融合评估 (RFA) 两个模 - 基于大语言模型的通用实体链接
我们提出了一种新的方法来从长描述中密集地连接视觉实体,利用大型多模态模型提取语义名词,利用无类别分割模型生成实体级分割,采用多模态特征融合模块将每个语义名词与其对应的分割蒙版关联。此方法利用颜色映射对实体分割蒙版进行编码,使得细粒度预测能够 - 去除与选择:通过粗糙到细化融合改进 RGB - 红外目标检测
本文介绍了一种新的粗到细的特征融合策略,利用 RGB 和红外图像的互补特性,通过去除冗余光谱和动态特征选择,提高了目标检测的性能。通过构建名为 RSDet 的新型目标检测器,并在三个 RGB-IR 目标检测数据集上进行广泛实验,验证了我们方 - 卷积神经网络在遥感场景分类中的 Kronecker 乘积特征融合
远程感知场景分类是一个具有挑战性和有价值的研究课题,其中卷积神经网络在其中发挥着至关重要的作用。本文提出了一种利用 Kronecker 积的新型特征融合算法,并讨论了与该算法相关的反向传播过程,实验证明了该方法在远程感知场景分类中提高卷积神 - DualFluidNet: 基于注意力的双管道网络用于准确和可推广的流固耦合仿真
提出一种创新的基于注意力的双通道网络方法,通过使用双通道架构和注意力特征融合模块,实现对三维流体模拟的精确预测和流体 - 固体耦合问题的优化。
- YOLO-OB:基于多尺度无锚点实时结肠肿瘤检测器的改进
本论文提出了一种名为 YOLO-OB 的新模型,通过双向多尺度特征融合结构和基于中心的无锚框回归策略,显著提高了息肉检测的各项性能指标,尤其是召回率,同时实现了基于 RTX3090 图形卡的实时息肉检测(每秒 39 帧)。
- 遥感图像去雾的编码器最小化和解码器最小化框架
提出了一种用于远程感知图像去雾的编码器极简和解码器极简框架 RSHazeNet,采用内层转置融合模块 (ITFM) 进行特征融合,采用跨层多视图交互模块 (CMIM) 和多视图渐进提取块 (MPEB) 增强特征学习,并通过大量实验证明了该方