- 不对称权重的深度学习
提出了 Product Feedback Alignment(PFA)算法,它在避免显式的权重对称的同时,几乎与反向传播(BP)算法相同,能够在深度卷积网络中实现可比较的性能,从而提供了对长期存在的权重对称问题的新解决方案,实现了更加符合生 - 基于众包昆虫图像的细粒度分类的计算机视觉算法性能
细粒度分类、物种识别、计算机视觉、深度卷积网络和视觉转换器是本论文的关键词。通过对 9 种算法进行详细评估,论文提供了对昆虫中的细粒度任务解决程度的全面理解,其中视觉转换器在推理速度和计算成本方面表现最佳,而局部性视觉转换器在性能和嵌入质量 - 基于模型无关方法的隐式神经表示任意尺度图像超分辨率
单张图像超分辨率(SISR)使用深度卷积网络取得了显著的进展,但传统网络只能将图像放大到固定比例,因此利用隐式神经函数生成任意比例的图像;本文介绍了一种新颖高效的框架 —— 混合专家隐式超分辨率(MoEISR),它在显著提高计算效率的同时, - 调制适配器多领域学习
本文提出使用 Modulation Adapters 进行卷积滤波器权重更新的方法,从而在多领域的图像分类任务中取得了比现有最先进方法更好或相当的效果。
- 结合卷积神经网络的神经进化增强拓扑
本文探索将神经进化算法应用于卷积神经网络拓扑结构优化,使用 Residual Networks 实现可变卷积神经网络拓扑结构,同时讨论如何对该系统进行优化以适应基于遗传算法的优化方法。
- CVPR使用 Transformer 的视频帧插值
使用 Transformer 和跨尺度窗口关注机制的视频帧插值方法,在多个基准测试上达到了新的最先进结果。
- 同时建模语音识别和合成:将词汇和亚词汇语义信息编码和解码为语音,无需直接访问语音数据
本文旨在研究如何从原始语音中自动生成词汇语义信息,并将其应用于无人监督的语音技术和语义建模领域。作者建立了包含生产和感知原则的深度卷积神经网络,通过自动编码和分类技术实现词汇语义信息自动解码。研究结果表明该网络能够从原始语音数据中学习到独特 - ICCV深度卷积网络中混淆对泛化的影响
本文研究了深度卷积网络中混叠对泛化性能的影响,并表明数据增强方案由于所使用的结构存在结构性限制而无法防止其影响。通过从频率分析理论中获得了启发,我们对 ResNet 和 EfficientNet 架构进行了更深入的研究,评估了它们各自主要组 - ICLR基于内核视角的深度卷积模型近似和学习
本研究通过核方法的角度对卷积核网络进行了研究,发现其 RKHS 由补丁之间的交互项的加性模型组成,其范数通过汇聚层促进这些项之间的空间相似性,并提供了泛化界,以说明池化和补丁如何提高样本复杂度保证。
- DFR: 无监督异常分割的深度特征重建
本文提出了一种基于无监督分割的异常检测方法,使用多尺度区域特征生成器从预训练的深度卷积网络中生成描述子区域的特征,借助这些特征设计一个深度自编码器并通过快速特征重建对图像中的异常区域进行检测,该方法在多个基准数据集上取得了最新技术进展,并具 - CVPR通过时间动作解析实现内部和外部交互理解
使用 TAPOS 数据集,针对深度学习在运动识别中的限制,提出了一种改进的时序划分方法,能挖掘出运动过程中的子动作信息,从而有效提高识别性能。
- ICML深度卷积网络对 Gabor 噪声的敏感度
本研究发现深度卷积神经网络对于一些特定的噪声图案,如 Gabor 噪声图案和程式化噪声图案,存在易受干扰性,仍需进一步研究其原因和影响。
- 基于迁移学习的小数据集糖尿病视网膜病变检测
研究探讨了如何利用预训练的深度卷积神经网络 (Inception-V3) 中的 Inception 模块进行糖尿病视网膜病变检测,以解决深度学习在医学数据分类问题中的标记数据不足的挑战。通过利用 Kaggle 糖尿病视网膜病变分类挑战数据集 - ICLR卷积神经网络单元中自然语言概念的发现
本文尝试理解深度卷积神经网络对自然语言任务训练时的表示方式,发现其各个单元对特定词素、单词和短语具有选择性响应,而非对任意难以解释的模式响应。作者提出了基于复制文本单位响应的概念对齐方法,对多个数据集的分类和翻译任务进行了定量分析,并为我们 - 动态稀疏重参数化实现深度卷积神经网络的参数高效训练
介绍了一种新的动态稀疏重参数化方法,能够更有效地训练深度卷积神经网络,在固定的参数预算下达到最佳准确率,并发现在训练过程中探索结构自由度比增加额外的参数对网络性能的提升更为有效。
- PnP-AdaNet:可插拔对抗域自适应网络及跨模态心脏分割基准
本文介绍了一种应对不同模态的医学图像的领域自适应的神经网络 PnPAdaNet,并在心脏结构分割上验证了其优秀的效果,同时还提出了一个新的基准数据集。
- 深度卷积网络中的反馈对齐
研究深度人工神经网络中的反向传播学习算法与大脑神经元突触可塑性规律的类比,介绍了不依赖于对称前向和后向突触权重的算法,提出通过加强权重符号一致性的反馈对准法的修改,可以实现与反向传播法相当的性能。这些研究结果表明,促进前向和反馈权重对准的机 - 全局二阶池化卷积网络
本文针对在深度卷积网络较早的层次有效引入二阶表示进行非线性建模的问题,提出了一种新的网络模型,并利用全局二阶池化 (GSoP) 对低到高层次进行二阶表示引入,使图像信息得到全面利用,实验结果表明,在 ImageNet-1K 数据集上,该网络 - MM深度卷积网络黑盒攻击的过程噪声对抗样本
本文介绍了一种使用程序噪声函数生成通用对抗扰动 (Universal Adversarial Perturbations,UAPs) 的方法,发现常见 DCN 模型(如 Inception v3 和 YOLO v3)具有系统漏洞,同时提出使 - 基于融合网络的亮度、深度和颜色信息用于语义分割
本文提出了一种名为 LDFNet 的新型解决方案,通过融合网络来综合利用亮度,深度和颜色信息,以提高 RGB-D 语义分割任务的性能,实验表明其潜力和适用性