- 具有改进骨干网络和多金字塔特征图增强结构的无人机探测器
本研究提出了一种改进的骨干和多金字塔特征图增强结构 (MDDPE) 的无人机探测器。通过使用不同层次的信息产生更加稳健和区分性的特征的新颖特征映射改进模块,增加了骨干模块的性能。这些模块包括特征图的补充函数和特征图的重新组合增强函数。为了有 - 多尺度先验混合的图像超分辨率知识蒸馏
MiPKD 是一种多粒度的先验知识蒸馏方法,通过在统一的潜在空间和随机网络块混合中实现特征混合,来促进高效的超分辨率模型,实验证明 MiPKD 方法的有效性。
- 基于注意力引导的特征蒸馏用于语义分割
提出的注意力引导特征蒸馏(AttnFD)方法利用精细特征图来传递关注力,证明了其在语义分割中提取丰富信息的有效性,通过只使用教师和学生的精炼特征图之间的均方误差(MSE)损失函数,在 PascalVoc 2012 和 Cityscapes - MCA:Moment Channel Attention 网络
通过研究神经网络中特征映射的统计矩,我们发现高阶矩在增强模型能力方面具有关键作用。因此,我们引入了一种灵活和全面的机制,称为 “广泛的矩聚合(EMA)”,以捕获全局空间上下文。在此机制基础上,我们提出了一种名为 “矩通道注意力(MCA)” - 深度神经网络中通路角色的理解
通过分析经过训练的卷积神经网络(CNN),我们提出了一种算法来提取各个像素的扩散路径,以确定与目标类别相关联的输入图像中像素的位置,并且这种基于路径的表示在不同类别之间具有明显的区别。
- 深度结构(随机)特征的学习渐近性
我们提供了一种针对大类特征映射的紧密渐近特征错误的表征,其中输入维度、隐藏层宽度和训练样本数在高维极限下成比例增加。我们的工作部分是受到了学习具有高斯彩虹神经网络的问题的启发,即具有随机但结构化权重的深层非线性全连接网络,它们的行协方差进一 - 基于截断 ANOVA 分解的快速可解释支持向量分类
支持向量机是一种在高维空间中处理分散数据进行分类的重要工具,本研究中利用基于三角函数或小波的特征映射来解决 SVM 问题,并通过多元基函数的限制实现计算效率的提升和解释性强的模型。同时,通过数值实例验证,使用 L1 范数正则化可以在准确性和 - 视觉 Transformer 需寄存器
提供额外的令牌以填补低信息背景区域中高范数令牌的内部计算,从而修复监督和自监控模型的问题,实现密集视觉预测任务的自监控视觉模型的最新技术,使用更大模型进行对象发现,为下游视觉处理提供更平滑的特征图和注意力图。
- ICML特征聚合的互信息折衷方法在人脸识别中的应用
本文提出一种利用两种最新的深度人脸识别模型 ArcFace 和 AdaFace 的输出进行聚合的技术,通过利用 Transformer 注意机制来改善人脸识别系统的总体区分能力,并通过引入信息瓶颈原理来确保聚合特征保留最相关和区分能力最强的 - ICCVDomainDrop:抑制与领域相关的通道以实现领域泛化
通过增强特征图通道对领域变化的鲁棒性,我们提出了一种新颖的领域泛化方法,实验证明该方法在多个基准测试中取得了最先进的性能。
- Strip-MLP:视觉 MLP 的高效标记交互
提出了一种名为 Strip-MLP 的新方法,通过引入 Strip MLP 层、CGSMM 模块和 LSMM 模块,增强了令牌交互的能力,改善了深层次特征的空间表达能力,并在小型数据集上显著提高了 MLP 模型的性能。
- 超越线性模式连通性:逐层线性特征连通性
本文主要研究神经网络训练过程中的参数空间和特征映射,提出了一种新的线性连接概念 LLFC 并进行了广泛的经验分析。对 LMC 的深入研究揭示了新的有关生成和置换方法的因素,从已训练的网络的每个层的特征映射的角度推进了对 LMC 的理解。
- 频域下的批量归一化
本文介绍了一种新的在频域归一化特征图的有效方法 - 频谱批量归一化(SBN),通过实验证明该方法可以避免特征图在初始化时和整个训练过程中的爆炸问题,使得深度神经网络的表现得到了显著提高。
- LLA-FLOW: 光流估计的轻量级代价体积局部聚合
通过在特征图上使用轻量化模块聚合代价体积,使用传统的局部区域约束来设计局部相似性聚合(LSA)和移位局部相似性聚合(SLSA),以降低光流估计中全局信息聚合所需的高昂内存和时间成本,同时保持有竞争力的性能。
- ECCVMixSKD: 图像识别中的 Mixup 自我知识蒸馏
本文提出了将 Self-KD 应用于图像混合 (MixSKD) 的方法,该方法能够将原始图像和混合图像之间的特征映射和概率分布相互蒸馏,以便以跨图像的知识指导网络的学习,实验表明该方法优于其他最先进的 Self-KD 和数据增强方法。
- AAAI基于关键点消息传递的视频行人重识别
本文提出了一种基于人体关节特征的人物重识别方法,通过采用图卷积网络与卷积神经网络相结合的方式解决了运动带来的误差问题。在 MARS 数据集和 PoseTrackReID 数据集上,该方法在 top-1 准确性和平均精度方面均优于前人工作,定 - SpectralDefense: 在傅里叶域中检测 CNN 的对抗攻击
该研究使用傅里叶域的分析方法和特征图的相位和振幅识别方法,成功地区分了对抗示例和良性测试图片,并提出了两种新颖的对抗检测方法。
- 使用师生模型学习真实数据集的通用特征映射的学习曲线
本文介绍一种 Gaussian 协变量泛化的 teacher-student 模型,可以在固定特征映射生成的不同空间中进行操作,可以捕捉广泛的现实数据集的学习曲线,并证明了渐近训练损失和泛化误差的严谨公式,讨论了该框架的能力和局限性。
- 核感知机的教学维度
本文研究了算法机器教学问题,针对核化感知器的不同特征映射家族建立了教学复杂度,即教学维度和样本复杂度。在特定的数据分布平滑假设下,建立了关于近似教学 Gaussian 内核感知器的复杂度严格边界,并在线性,多项式和高斯核感知器的几个典型场景 - ICLR关于无 Ridge 回归中双峰下降峰的普适性
证明了在 ridgeless 线性回归中,标签噪声导致的预期平均平方泛化误差的非渐进分布独立下界,并推广了类似的已知结果到过参数化(插值)区域,并适用于具有几乎定概率的全秩特征矩阵的广泛输入分布类,包括根据随机深度神经网络构造的特征映射。