- 苏丹方言的端到端自动语音识别模型
本研究检验了针对苏丹语方言设计自动语音识别模型的可行性,并使用卷积神经网络设计了一种端到端语音识别模型,该模型在苏丹方言数据集上取得了 73.67% 的平均标签错误率
- FSCNN: 一种快速的稀疏卷积神经网络推理系统
本文主要介绍了利用大规模稀疏结构提高卷积神经网络推理效率的方法, 开发了一种名为 FSCNN 的稀疏卷积神经网络推理系统,能够在一定的稀疏程度下优于标准深度学习库 PyTorch,但遇到高优化密集运算时推理效率有一定局限性,因此推荐采用粗粒 - ECCV成本约束通道剪枝的软遮罩技术
本研究提出一种新的卷积神经网络通道剪枝方法,采用软化掩码方式剪枝,从而实现网络速度显著加快并限制成本,同时在 ImageNet 分类和 PASCAL VOC 检测数据集上取得了优异的表现。
- 基于相似度的卷积神经网络被动式滤波剪枝压缩方法
通过 Nyström 近似方法,提出了一种高效的基于相似度的被动滤波器剪枝方法,相比于基于相似度的滤波器剪枝方法,其计算速度快三倍,准确率相同,该方法还表现出与现有基于范数的剪枝方法相似或更好的效果。在 DCASE 2021 任务 1A 基 - ECCVGraphCSPN: 基于动态 GCNs 的几何感知深度补全
本文提出了一种图卷积空间传播网络(GraphCSPN)来完成深度补全的任务,该方法通过卷积神经网络和图神经网络的结合学习几何表示,通过可学习的几何约束规范化三维空间中的传播过程,利用特征块构建的图动态更新并加入边的注意力模块,从而更好地捕捉 - ECCV使用视觉转换器进行强引力透镜参数估计
本文使用 Vision Transformer (ViT) 模型在 31,200 个模拟的强引力透镜图像上进行了实验,与传统方法相比在运行速度和成果方面有很大的提升,特别是在参数估计上更为优秀。这为下一代强透镜科学提供了有力的工具,代码和数 - 加速视频超分辨率模型的训练
本文提出采用多级培训策略来加速视频超分辨率模型的训练,早期阶段的模型尺寸更小。同时,使用 GPU 并行化加快培训速度。实验证明,该策略可以在保持准确率的情况下加速培训达 6.2 倍。
- CVPRGPUNet:基于 GPU 的可部署卷积神经网络搜索
该论文介绍了一种使用神经架构搜索技术快速定制卷积神经网络模型的方法。该方法构建了一个分布式的神经架构搜索系统,探索一个新的潜在搜索空间,并提出了一种使用 GPU 进行目标推理的优化模型 GPUNet,其推理速度可达 1ms,比现有模型具有更 - 实现边缘智能动态卷积神经网络推理的探索
本研究提出了动态流式传输模型参数和基于库的方法来实现传统 CNN 架构的可扩展和动态分布式 CNN 推断,利用部分重构技术提高了资源受限的边缘设备的性能,并在 Xilinx PYNQ-Z2 板上实现了 LeNet-5 CNN 模型,具有 9 - 基于增强卷积神经网络的物联网心电图信号有效分类
本文提出了一种基于物联网技术的新型心电监测方法,使用基于 DSR 和 REL 的路由系统,并测试了基于 ANN、SVM 和 CNN 的 ECG 信号分类方法。Deep-ECG 将采用深度 CNN 来提取重要特征,并使用简单且快速的距离函数进 - UniFormer:统一卷积和自注意力机制用于视觉识别
提出了一种新方法 UniFormer,能够将 CNN 和 ViT 的优点融合到一个新的强大的支持各种视觉任务,包括图像分类、目标检测、语义分割和姿态估计等的 Transformer 模型中,并在不需要额外训练数据的情况下,达到了 Image - 基于面部属性的抑郁症自动识别的神经网络结构搜索
本研究使用神经架构搜索技术为基于多种面部属性的抑郁症识别设计最佳模型,并通过 AVEC2016 数据集的实验结果验证了该模型的可行性和准确性,为基于时间序列数据的心理健康分析提供了坚实的证据和强有力的基础。
- 可学习的多级频率分解和分层注意力机制用于广义人脸攻击检测
提出一种双流卷积神经网络框架,其中一流在频域中适应四个可学习频率滤波器来学习特征,另一流利用 RGB 图像来补充频域特征,通过分层注意力模块进行信息融合,提升面部呈现攻击检测方法的泛化能力。
- SPIN Road Mapper:通过空间和交互空间图推理从航拍图像中提取道路以用于自动驾驶
提出了一种基于 SPIN 模块和金字塔网络的道路识别方法,该方法可以从卫星图像中高效且准确地提取出道路信息,并且在训练时收敛速度快。
- ICCVHandFoldingNet:一种使用 2D 手骨架的多尺度特征引导折叠的 3D 手势姿态估计网络
该论文提出了一种基于 Folding 的手部姿态估计器,该模型利用多尺度特征进行折叠,可以从归一化的 3D 手部点云输入中回归出手部关节位置,试验结果表明,该模型在三个手部姿态基准数据集上优于现有方法,且模型参数要求最低。
- 图像融合变换器
本研究提出一种新的基于 Transformer 的图像融合方法,采用多尺度融合策略同时关注局部和全局信息,使用卷积神经网络与 Transformer 分支捕捉局部和长程特征,经对比实验表明,该方法优于当下多种融合算法。
- DeepViT: 朝更深层次的 Vision Transformer 进发
本文发现 Vision transformers 模型存在 attention collapse issue 现象,即 transformer 模型越深层次的注意力权重变得越相似,严重影响模型性能,提出了一种名为 Re-attention - 使用注意力机制卷积神经网络预测关节 X 光图像中的关节损伤
该研究提出了一种综合目标检测和卷积神经网络与注意力的两阶段方法,可以高效准确地预测 RA 患者手脚关节的总体和关节水平的狭窄和侵蚀疾病损害,该方法已在 RA2 Dream Challenge 中排名第四和第八位,并取得了显著结果。
- ECCV一像素签名:卷积神经网络后门检测模型的特征化
通过提出一种新的称为一像素签名的表示方法来解决卷积神经网络中的后门检测问题,并且相对于现有的竞争方法,我们的一像素签名表现出了显著的改进。
- 基于公理的 Grad-CAM:CNN 的准确可视化和解释
本文提出了两个公理– 保守性和灵敏度,为 CAM 方法的可视化范式引入了理论支持,并提出了一个专门基于公理的 Grad-CAM(XGrad-CAM),以尽可能地满足这些公理。实验证明,相对于 Grad-CAM++ 和 Ablation-CA