- 科尔莫戈洛夫-阿诺德卷积:设计原则与实证研究
本文探讨了 Kolmogorov-Arnold Networks 在计算机视觉领域的应用,提出了参数高效的设计和微调算法,并在图像分类和分割任务中取得了最新成果。
- R-CONV:一种通过卷积梯度实现高效数据重建的分析方法
该研究论文介绍了一种高级数据泄漏方法,可以高效地利用卷积层的梯度,证明了现有用于估计梯度攻击风险的分析方法缺乏准确性。
- 具有多个输出和卷积层的有限宽度贝叶斯深度线性网络中的特征学习
在此研究中,我们对多输出和卷积层的有限宽度结构的函数统计提供了严格的结果,从而更接近完整描述贝叶斯设置中特征学习的过程。我们的结果包括:(i)一个对于输出的联合先验分布的确切且简单的非渐近积分表示,以高斯混合形式给出;(ii)在均方误差损失 - 卷积 L2LFlows:使用卷积归一化流生成高粒度量能器中准确的射流
为了构建计算效率高且能代替基于规则的模拟的生成式替代模型,本研究扩展了 L2LFlows 以模拟具有较大剖面尺寸的洗澡水,并引入了卷积层和 U-Net 型连接,从掩蔽自回归流变为耦合层,在 ILD 电磁量热计以及公共 CaloChallen - 融合图像和雷达测量的深度估计与不确定方向
本文提出了一种使用雷达图像融合进行深度估计的方法,该方法通过解决稀疏雷达测量的不确定垂直方向来融合图像特征和雷达深度,通过准确的 LiDAR 测量来确定可能正确的雷达方向,实验证明我们的方法相较于基准方法可以提高量化和定性结果。
- Roesser 型卷积层的状态空间表示
从控制论的角度看,卷积层(神经网络的一部分)是二维(或 N 维)线性时不变动态系统。我们提供了 Roesser 类型的二维卷积层的状态空间表示,以便使用控制论中的分析工具,比如线性矩阵不等式。此表示对于输入 / 输出通道数相等的情况已被证明 - 隐式线性层的频谱抽取和裁剪
我们展示了自动微分在高效正确地计算和控制隐式线性运算符的频谱上的有效性,包括所有标准卷积和稠密层的一系列丰富类型。我们提供了第一种正确应用于一般卷积层的剪切方法,并阐明了之前研究中导致正确性问题的表征限制。我们研究了批归一化层与卷积层串联时 - conv_einsum:卷积张量神经网络中多线性操作的表示和快速计算框架
这篇论文提出了一种用于表示张量卷积层的统一框架,以及一种能够以最小化浮点操作数(FLOPs)的方式评估这些框架的方法,实验证明 conv_einsum 显著提高了卷积张量网络的计算和内存效率。
- DECO: 基于查询的端到端目标检测与卷积神经网络
通过构建一个基于查询的以卷积网络为基础的端到端目标检测框架 DECO,本研究探索了是否能够用卷积网络来取代复杂的 Transformer 架构,该框架在复杂性较低的情况下实现了与传统的物体检测模型相媲美的性能,并带来了另一种设计目标检测框架 - 平衡分组卷积:基于近似能力评估的改进分组卷积
神经网络的性能通过增加卷积层中的通道数得到了显著提高,但性能提升伴随着更高的计算成本。本文进行了对组卷积的理论分析,以确定其近似标准卷积的能力,并提出了一种名为平衡组卷积的新型变种,它在较小的附加计算成本下显示出更高的近似能力。实验证明了平 - 稀疏编码解码器实现的医学图像分割
基于卷积稀疏向量编码的解码器,名为 CASCSCDE,在医学图像分割中有效地提升了 Transformers 模型的性能。
- ICCV填充感知神经元
通过激活值识别和研究静态填充卷积模型中的边界感知神经元,探索它们对模型性能的影响以及其在数据中引起的偏差。
- 语言 Transformer 中的解码器层显著性解读
我们介绍了一种在应用于分类任务的大规模语言模型中识别文本显著性的策略。我们采用了渐变基础的显著性方法,并提出了一种评估每一层语义一致性程度的方法,在多个基准分类数据集上展示了相对于其他方法的一致性改进。我们的方法不需要额外的训练或标记数据, - R-Block: 卷积网络的正则化 Dropout 块
通过引入互相学习的训练策略,即 R-Block,结合两个不同 dropout 区域的互补子模型,该方法能够减小卷积层中的随机性,提高了性能和一致性。
- 探索锐化余弦相似度
我们的工作中,我们探讨了 Sharpened Cosine Similarity(SCS)参数的行为和潜力,并且研究了在多个卷积神经网络结构中用 SCS 替换卷积的效果。我们发现,虽然 SCS 可能不会显著提高准确性,但可能会学习到更易解释 - Conformer LLMs -- 卷积增强的大型语言模型
本文将卷积层和 Transformer 这两个流行的神经网络块与大型语言模型(LLMs)进行整合。通过使用因果卷积滤波器和 Transformer 将潜在表示的局部和全局依赖相结合,取得了显著的性能提升。这项工作展示了一种强大的语音架构,可 - 通过跳过零值来减少卷积层的计算复杂度
本文提出了 C-K-S 算法,通过去除填充值和将稀疏张量转换为密集张量等方式减少生成深度神经网络运算时 0 值造成的计算冗余, 并在 GPU 上实现进行了高效的反向传播运算, 有望进一步方便对特定 GPU 的全面优化。
- 成功深度学习的机制
本文提出了一种有效的三阶段程序来量化成功的深度学习机制,通过 VGG-16、VGG-6 和 AVGG-16 的定量分析,发现每个 Convolutional 层的过滤器会选择一个独立于输入标签的单个输出标签子集,这是该机制不可或缺的一部分, - ICML基于 Hadamard 变换的混合量子经典方法用于卷积层
本文提出了一种基于 Hadamard 变换的 HT-perceptron 层,用于混合量子经典计算,相较于常规的 Conv2D 层,在 MNIST 和 ImageNet-1K 数据集上分别减少了 57.1% 和 12.6% 的 MACs 且 - Ray-Patch:用于光场 Transformer 的高效解码器
本文提出了一种新的 Ray-Patch 解码器模型,可以有效地从 implicit representations 中解码出目标视图,将目标图像分成一组 patch,然后对于每个 patch 查询 transformer 以提取一组特征向量