- 视频中草书字幕文字的检测
本文提出了一种鲁尔祖语草书文本的视频帧中的文本内容检测技术,使用基于深度卷积神经网络的对象检测器对视频帧中的文本区域进行检测,并使用脚本识别模块区分草书文本和拉丁文本,最后将检测和脚本识别结合成单个可训练的系统,并在一组综合数据集中获得了 - 减少深度卷积激活特征 (R-DeCAF) 在组织病理学图像中用于提高乳腺癌诊断分类性能
本文提出一种基于深度卷积神经网络(DCNN)的计算机辅助诊断(CAD)方法,使用不同的降维方法组合 DCNN 的特征,提高二分类任务的准确性。实验结果表明,在 BreakHis 数据集上,使用预训练 AlexNet 作为特征提取器和线性降维 - AAAI基于迁移学习技术的黑素瘤分类比较分析
使用深度卷积神经网络进行皮肤癌的早期检测和分类,有助于减少高昂的医疗费用并提升治疗效果。
- IEEE 大数据杯 2022:基于深度学习的加密图像隐私保护匹配
本文介绍了一个基于深度卷积神经网络和数据增强技术的解决方案,用于 IEEE Big Data Cup 2022 挑战中隐私保护匹配加密图像的任务,并在该挑战中获得第一名。主要关键词为智慧城市、智慧传感器、隐私保护、加密技术和深度卷积神经网络 - 通过层间内核共享大幅减少深度卷积神经网络中可训练参数数量
提出在深度卷积神经网络中通过共享卷积层核来减少可训练参数数量和内存占用的方法,既能够缓解边缘计算内存限制,又能有效地防止过拟合。实验证明该方法能够在保持精度的情况下大幅减少模型大小。
- 卷积神经网络量化与注意力机制
本文提出双阶段压缩与阈值化方法 (double-stage ST),使用注意力机制量化网络,在卷积前插入即可实现,达到超越全精度基线模型的准确性。
- 基于拉普拉斯光谱下累加最大缩放面积的数据集复杂度评估
本文提出了一种名为 cmsAULS 的新方法,通过计算 Laplacian spectrum 的面积来评估数据集的复杂性,从而可以在训练 DCNN 模型之前有效地预测分类性能,并在六个数据集上实现了最先进的复杂性评估性能。
- SR-GNN: 面向细粒度图像分类的空间关系感知图神经网络
本文介绍一种有效的方法,通过聚合来自最相关的图像区域的上下文感知特征及其在区分细粒度类别中的重要性来捕获细微变化,避免边框和 / 或可见部分注释,并通过自我关注和图形神经网络的最新进展来包括一种简单而有效的关系感知特征变换及其在端到端学习过 - ECCV基于 Shapley 值的卷积神经网络视觉解释
本文提出 Shap-CAM,一种基于类激活映射的新型后续可视化解释方法,通过获取 Shapley 值来消除依赖于梯度的先前方法的不足,表现出更好的视觉性能和公平性以解释决策过程。
- 手写文字识别的 2D 自组织 ONN 模型
本研究提出了一种新的神经网络模型,其中包含了 2D 自组织 ONNs 和可变形卷积。在 IAM 英语数据集和 HADARA80P 阿拉伯语数据集上,将 Self-ONNs 操作层与可变形卷积相结合,大幅减少了字符错误率和词错误率,且性能显著 - Transformers 改善未注册多视角乳腺 X 线诊断
研究使用多视角视觉 Transformer 构建计算机辅助诊断方案,在不需要繁琐的预处理步骤的情况下,基于四张乳腺 X 线照片的 Transformer 模型达到了 81.8% 的诊断准确率,优于当前多视角 CNN 的诊断准确率。
- 使用深度网络对低维流形上的非参数离策略评估进行样本复杂度分析
该研究考虑使用深度卷积神经网络对强化学习的离线策略评估问题进行分析,发现通过适当选择网络大小,可以利用马尔科夫决策过程中的任何低维流形结构,获得一个高效的估计器。同时,该研究还提出一种新的逼近算法,并在数值实验中验证理论分析。
- 深度学习胎儿超声视频模型在生物测量方面与人类观察者相匹配
使用深度卷积神经网络(CNN)自动测量胎儿头围、双顶径、腹围和股骨长度,以及使用胎儿超声视频估计胎龄和胎儿重量,利用名为 FUVAI 的新型多任务基于 CNN 的时空胎儿 US 特征提取和标准平面检测算法。我们发现,自动测量胎儿生物测量学功 - CVPRCNN 模型压缩的通道探索 (CHex)
提出了一种名为 CHEX 的新型通道探索方法,使用 CSS 解决层内的通道修剪问题,使用回归阶段解决层间的动态重新分配通道数量的问题。所有探索过程都是在单次训练中完成的,实验结果表明,CHEX 可以有效地减少各种 CNN 架构的 FLOPs - IJCAIChimeraMix:通过特征掩码混合进行小数据集图像分类
我们提出的名为 ChimeraMix 的深度学习网络架构通过生成实例组合的数据增强方式,解决了在小数据集上进行深度学习的限制,并在基准数据集上展示了优于现有同类方法的分类性能。
- BA-Net:用于深度卷积神经网络的桥接注意力
本文提出了 Bridge Attention Net (BA-Net) 这一简单的策略,通过跳跃连接将前面的卷积层的输出连接起来以提高通道注意力机制的性能,并在实验中展示其比现有方法在精度和速度方面均取得了最先进的性能,这表明 Bridge - AAAI利用正则化流抑制静态视觉提示的自监督视频表示学习
提出了一种基于概率分析的新方法,通过对视频编码进行正态流处理和随机变量建模来抑制静态视觉提示,从而获得更可靠的视频表示,这可以被更好地推广到各种下游任务中。
- 实例识别的平衡学习方法研究
本文提出了一种针对实例识别的平衡学习框架 Libra R-CNN,其中包括 IoU 平衡采样、平衡特征金字塔和目标重加权,以分别减少样本级别、特征级别和目标级别的不平衡性,通过对 MS COCO、LVIS 和 Pascal VOC 等数据集 - ICCV使用深度卷积神经网络在儿科胸部 X 光片中自动诊断多种疾病
本文研究了利用改进的 “分布平衡损失函数” 训练基于深度卷积神经网络(D-CNNs)的模型来自动分类儿科肺病的多个病理学表现,为解决医师标注样本稀缺、类别不平衡等问题,作者构建了一个包含 5,017 份儿科胸部 X 光片的数据集,并证明了这 - ICCV卷积神经网络上的代表性解释发现
本文提出一种基于无监督学习的方法来解释大量相似图像中深度卷积神经网络的决策逻辑,并将代表性解释问题转化为一种共聚类问题,并基于线性决策边界的样本将其转化为子模代价覆盖问题。我们还提供了可视化和相似性排序方法,广泛的实验证明了本方法的优秀表现