- CVPR具有空间频率感知和逼真亮度约束的半监督夜晚去雾基线
我们提出了一种半监督模型来解决现实世界夜间去雾问题,通过采用空间注意力和频率谱滤波进行信息交互处理以处理夜间模糊场景,设计了基于伪标签和局部窗口的亮度损失的重新训练策略,以抑制雾气和光晕并实现真实亮度。通过对公共基准的实验证实了所提方法的有 - LKCA:大卷积核关注
我们重新审视了注意力机制与大内核卷积神经网络在视觉转换器中的关系,并提出了一种称为大内核卷积注意力(LKCA)的新空间注意力机制。它通过将注意力操作替换为单个大内核卷积来简化注意力机制。LKCA 结合了卷积神经网络和视觉转换器的优势,具有大 - SpACNN-LDVAE:用于高光谱像素解混的空间注意力卷积潜在狄利克雷变分自编码器
该研究使用了具有空间注意力的各向同性 CNN 编码器来解决高光谱解混问题,并结合转移学习范式进行了实证评估,结果表明在端元提取和含量估计方面引入空间信息能够改善结果。
- 双流神经网络解释人类大脑中背侧和腹侧视觉通路的功能分离
人类视觉系统使用两个并行通路进行空间处理和物体识别,而计算机视觉系统往往使用单一的前馈通路,导致其鲁棒性、适应性和效率低于人类视觉。为了弥补这一差距,我们开发了一种受人类眼睛和大脑启发的双流视觉模型,模拟人眼使用巨细胞和小细胞视网膜神经节细 - 应用深度学习于具有不同电极布局的脑电图数据的空间注意力
通过对脑电数据进行空间注意力调控和信道协调,探讨了在不同电极脑电数据下使用深度学习模型的性别分类任务,并以实验证明使用不同电极脑电数据进行训练的深度学习模型在性别分类中显著优于使用固定 23 通道和 128 通道数据的模型。
- AIC-AB NET: 带有空间关注和文本属性的图像字幕神经网络
本研究提出并介绍了一种新型的属性 - 信息组合注意力网络 AIC-AB NET,将空间注意力架构和文本属性相结合,以生成图注。经过对 MS COCO 数据集和一个新的时尚数据集的测试和评估,结果显示所提出的模型相对于最先进的基线模型和删除模 - 语音增强中高效编码器 - 解码器和双通道 Conformer 的综合特征学习
该论文提出了一种基于改进密集连接块、双路径模块、卷积增强变形器、通道注意力和空间注意力的时间频域语音增强网络(DPCFCS-Net), 在 VCTK+DEMAND 数据集上表现优于现有技术,其改进的密集连接块和二维注意力模块易于集成到现有网 - SACANet:用于遥感图像语义分割的场景感知类别注意力网络
本文提出了一种基于场景感知注意力的空间注意力模块和局部 - 全局类注意力机制,以此构建一种应用于遥感图像语义分割的场景感知类别注意力网络(SACANet),试验表明 SACANet 的性能优于其他最先进的方法并验证了其有效性。
- 基于注意力机制的脑肿瘤二阶段 MR 图像分割方法
提出了一种基于 CASP-GAN 的协调空间注意力生成对抗网络,以及一种关注性生成跨模态分割方法,该方法在脑肿瘤分割中取得了比 CycleGAN 和部分前沿方法更好的结果。
- 针对边缘设备物体检测的延迟攻击
本文探讨了深度学习应用程序遭受的延迟攻击,并提出了一种新的框架名称为 Overload,用于在物体检测中生成这种攻击。实验结果表明,相比现有方法,我们的攻击方法更简单更有效。
- RFAConv:创新的空间注意力和标准卷积操作
提出了一种新的注意力机制 —— 接收场注意,该机制不仅专注于感受野的空间特征,而且为大尺寸卷积核提供了有效的注意力权重,实现了用接收场空间特征替换空间特征的新方法,提高了网络的性能。
- 面向部位感知的动态模板初始化的人物再识别
本文提出了一种基于空间注意力的动态部件模板初始化模块,该模块使用骨干网较早层的中级语义特征动态生成部分模板。我们还探索了自适应加权部分描述符来量化局部属性的缺失或遮挡,增强了对人体各部分的表示的识别能力,并在整体、遮挡和部分 Re-ID 任 - ECCV词级细粒度故事可视化
本论文提出了一种新的句子表示方法来减轻不一致问题,并引入了融合特征的新的鉴别器和扩展的空间注意力来提高图像质量和故事连贯性,实验表明,与现有方法相比,该方法具有优越的性能。
- MaskViT: 视频预测的掩蔽视觉预训练
本研究展示通过基于遮蔽视觉建模的 Transformer 预训练可以创建良好的视频预测模型,且仅需最少领域知识即可赋予具有强大预测模型的实体智能体。
- 多样性 vs. 可识别性:一次性生成模型中的类人泛化
本文提出了一种新的评估单次生成模型的框架,用于比较其与人类生成的差异,确定其代表人体模型的模型以及模型参数。该框架通过对样本可识别性和样本多样性(即类内差异)两个方面进行评估,并对代表性单次生成模型在 Omniglot 手写数据集上进行了详 - IJCAI动态多图注意力实现长期时空预测
本文研究多图神经网络在长期时空预测中的应用,提出了一种新的动态多图融合模块来描述不同图之间的节点相关性,并引入可训练权重张量来指示不同图中每个节点的重要性。实验证明,我们的方法在长期时空预测任务中显著提高了现有图神经网络模型的性能。
- CVPR双向物体 - 背景优先级学习用于显著性排名
该论文提出了一种新颖的双向方法,将空间注意力和基于对象的注意力相结合,通过模拟所关注区域和对象之间的相互作用和因果关系来实现显著性排序
- MTLDesc: 扩大视野,提升描述能力
通过采用上下文增强和空间注意机制,本文提出了一种可获得非局部感知的本地描述符方法,并在诸如 HPatches,Aachen Day-Night 定位和 InLoc 室内定位基准测试中,显著超越了先前的最先进本地描述符。
- Twins: 重访视觉 Transformer 中空间注意力设计
本文针对密集预测任务,重新设计了空间注意力机制,提出了 Twins-PCPVT 和 Twins-SVT 两种高效且易于实现的视觉转换器架构,并在图像分类、密集检测及分割等视觉任务上取得了出色的性能表现。
- 快速注意力实时语义分割
该论文提出一种新的 CNN 模型结构和快速空间注意力机制,能够在实时高分辨率图像和视频上进行语义分割,同时实现更好的准确性和速度。在 Cityscapes 数据集中,该模型在单个 Titan X GPU 上实现了 74.4% mIoU 的