- 基于卷积变换器的端到端神经性癫痫检测(EENED)
本文提出了一种融合了 Transformer 和 CNN 的端到端神经网络癫痫检测模型 EENED,在其 Transformer 编码器中引入卷积模块,从而结合了 Transformer 模型全局依赖捕捉和 CNN 模型局部特征捕捉的优势, - 更精确、更整洁的人脸检测:反向非极大值抑制
该论文介绍了一种新的基于 CNN 和 NMS 算法的人脸检测方法,可以有效处理低质量图像和小人脸,可以作为不同人脸检测方法的后处理器。
- 元 - 息肉:高效息肉分割的基线模型
本研究提出了使用 Meta-Former 与 UNet 的融合模型,并引入多尺度上采样块与级联组合以提高纹理,并提出 Convformer 块增强局部特征,以实现医学分割的全局信息、局部信息和边界信息等敏感点的更好决策。该模型在 CVC-3 - 使用深度学习和多模态显微镜在 347H 不锈钢中自动分割晶界并进行显微结构分析
本文利用卷积神经网络技术进行微观组织中晶界的检测,结合不同仪器下的多模式显微镜技术生成像素级标签,提高了检测精度,并且通过引入拓扑信息,得到了更好的分割性能和晶粒形貌分布预测。
- CVPR基于混合 Transformer 和卷积神经网络的立体图像超分辨率注意力网络
提出了一种名为 HTCAN 的混合 Transformer 和 CNN 注意网络的方法,该方法使用基于 Transformer 的网络进行单幅图像增强和基于 CNN 的网络进行立体信息融合,最终在 NTIRE 2023 立体图像超分辨率挑战 - 深度学习模型中的特征手性
通过 CNN 在图像识别中应用视觉手性区别图片是否翻转,我们在本文中研究了特征手性的特性,提出了特征手性的概念和测量方法,并在 AlexNet、VGG 和 ResNet 模型上分析获得了类似但令人惊讶的结果,表明特征手性暗示了模型评估、模型 - 联合结构和扩散 MRI 进行丘脑核的领域不可知分割
该研究提出了一种使用卷积神经网络(CNN)从任意分辨率的 T1 和扩散数据中区分丘脑核的方法,该方法基于一种公共组织学图谱和高质量扩散数据的银标准分割工具,并可应用于不同来源的数据集。
- 一种可靠的深度学习方法用于伊朗车牌识别
使用基于卷积神经网络(CNN)的 YOLOv4-tiny 模型检测车牌,利用卷积递归神经网络(CRNN)和 CCT 算法进行检测,无需将字符分割和标注,只需提取车牌号码。
- 基于特征的深度卷积神经网络单张图像去雨
本研究提出了一种基于数据驱动和基于模型相结合的单幅图像去雨方法,通过使用 CNN,高频信息提取,特征转换,和使用注意机制的神经网络,实现了优异的效果。
- 用于单目深度估计的高分辨率合成 RGB-D 数据集
本文使用 Grand Theft Auto (GTA-V) 生成高分辨率的合成深度数据集 (HRSD),包含 100,000 张彩色图像和相应的密集地面真实深度图,实验结果表明,使用此数据集训练的 DPT 算法在不同场景下的深度估计精度提高 - DIAMANT: 双视图注意力映射编码器用于医学图像分割
本文提出了一种简单的纯卷积神经网络模型,通过从预训练 DINO 模型的多个注意力头中获得的注意力图可视化来提高医学图像分割的性能,并超过了 U-Net 和现有的医学图像分割模型。
- 通过深度强化学习实现高效的半色调处理
本文提出了一种基于强化学习和深度学习(CNN)的快速半色调处理方法,该方法具有结构感知性,并且可产生良好的蓝噪声半色调效果。
- CVPR学习基于偏相关的深度视觉表征,用于图像分类
本研究通过将 SICE 算法作为 CNN 的一个新型结构层,实现了利用偏相关方法构建图像的特征矩阵。与协方差矩阵比较,基于偏相关的图像特征矩阵可以更好地改善样本量小的问题,并在分类任务中获得优异的性能表现。
- 使用 Mediapipe Holistic 的印度手语识别
通过使用卷积神经网络和 LSTM 模型进行手势和静态手语识别,研究开发了一种印度手语转换为文本或语音的文本 - 手语翻译模型,可以帮助聋人和听障人士在社交、教育和职业场境中进行更准确的交流。
- 婴儿啼哭的弱监督检测
使用弱监督的异常检测方法,结合卷积神经网络和预训练特征提取器检测宝宝的哭声。
- 使用深度学习方法和单帧 CNN 及卷积 LSTM 进行人类活动识别
本文探讨了基于深度学习的两种方法 —— 单帧卷积神经网络和卷积长短时记忆,以实现从视频中识别人类行为,同时在 UCF50 数据集和实验数据集上对两个模型进行了评估,结果表明单帧 CNN 模型的准确性优于卷积 LSTM 模型。
- 面部和颈部癌症患者的肿瘤图学习进行生存预测
通过 U 型卷积神经网络进行头颈部区域分割,结合支持向量机分类器实现肿瘤的语义分割,采用 Weibull 加速失效时间模型和深度学习等方法进行存活预后预测,在图像块处理方面探索性地进行图形卷积,从而实现对头颈癌进行自动分割和预后预测,测试数 - CVPRU2RLE: 基于不确定性引导的二阶段房间布局估计
提出了一种新的基于深度学习的房间布局估计方法,引入了一种新的两阶段 CNN 体系结构,包括不确定性引导的定位边界估计和 处理视野内和视野外的边界,使用网络的不确定性和基于距离的损失函数精确提取边界,并在 ZInD 和 Structure 3 - 图像分割中动态特征缩放的分摊学习
本文介绍了一种新的超网络策略可以用来快速生成卷积神经网络,从而用于处理图像分割任务,在尽可能地保证准确性的前提下提高计算效率,并成功展现了各种域的价值。
- 一个实时面部情绪识别的实验研究(基于新的 3RL 数据集)
本研究针对实时面部表情识别领域的数据集问题,创建了包含约 24,000 张标记为五种基本情绪的 3RL 数据集,并在该数据集上使用 SVM 和 CNN 算法进行比较和评估,结果显示 CNN 算法在 3RL 数据集上具有显著的泛化能力提高,达