- FunnelNet:一种端到端的深度学习框架,实时监测数字心脏杂音
使用传统和深度可分离卷积网络开发了一种新型的端对端实时心脏杂音检测方法,通过连续小波变换从心音图数据中提取有意义的特征,并在有限资源下实现了实时准确的心脏杂音检测。
- 可解释梯度的学习范式
本论文研究了卷积网络的可解释性,通过利用显著性图进行分析。我们提出了一种新的训练方法,通过引入正则化损失,使标准反向传播得到的输入图像相对于引导反向传播得到的梯度类似。我们发现,由此得到的梯度在质量上更加清晰,量化上改善了不同网络的可解释性 - 医学视觉引导(MVP):一种用于多功能和高质量医学图像分割的统一框架
准确分割病变区域对于各种疾病的临床诊断和治疗至关重要。本研究提出了一种新颖的医学视觉提示 (MVP) 框架,借鉴了自然语言处理 (NLP) 的预训练和提示概念,通过整合 SPGP、IEGP 和 AAGP 三个关键组件,使得分割网络更好地学习 - 超声数据中前列腺癌检测图像变换的基准测试
用深度学习方法结合卷积网络和 transformers 的多尺度方法在前列腺癌的超声图像分类中表现最佳,而多目标学习可以提高性能。
- 通过多模型合奏进行复合表达式识别
我们提出了一种基于集成学习方法的复合表情识别的解决方案,通过训练基于卷积网络、Vision Transformers 和多尺度局部注意力网络的三个表情分类模型,通过模型集成使用后期融合的方法,我们能够在 RAF-DB 上实现高准确率,并能够 - MiM-ISTD:高效红外小目标检测中的蟒蛇嵌套
通过将卷积网络与 Transformer 相结合的结构,本文探索了一种用于高效红外小目标检测的 Mamba-in-Mamba 结构,该结构通过对局部块进行子块分解,利用每个子块之间的相互作用来大大提升 MiM-ISTD 的表征能力和计算效率 - 基于注意力的分层变分自编码器的分子生成
将递归神经网络与卷积网络以层次化方式结合,可以从 SMILES 字符串中提取自回归信息并保持信号和长程依赖关系,从而实现了在重构已知分子时非常高的有效性率达到 95%。同时,我们观察到测试集和重构分子之间的平均 Tanimoto 相似性为 - 自适应平滑激活以改善来自放射学扫描的疾病诊断和器官分割
本研究提出了一种新的激活函数,称为自适应平滑激活单元(ASAU),专为优化梯度传播而设计,从而提高了卷积神经网络在医学图像分析中的效能。我们将这个新的激活函数应用于医学图像分析中的两个重要和常用的任务:CT 和 MRI 中的自动疾病诊断和器 - 基于局部视觉变换器的交通标志识别
通过结合卷积网络和 Transformer 网络的优势,本研究提出了一种新型的模型用于交通标志识别,实验证明该模型在德国和波斯交通标志数据集上超过了纯 Transformer 模型和最佳卷积网络的准确率,并且在保持快速推理速度的同时,更适合 - EDiffSR: 一种高效的远程感知图像超分辨率扩展的扩散概率模型
本论文介绍了一种用于高效遥感图像超分辨率的扩散概率模型(DPM)EDiffSR,并结合了高效的激活网络(EANet)和条件先验增强模块(CPEM),以提高遥感图像的视觉质量和细节恢复能力。
- ICCV保持简洁:谁说监督 Transformer 受注意力不足之苦?
我们通过提出一种通用的池化框架,将卷积网络和视觉变换器的默认池化机制替换为简单的基于注意力的池化机制 SimPool,从而改善了预训练和下游任务的性能,并在所有情况下提供了能够描绘物体边界的注意力分布图。
- MM通过组合神经网络简化多波段映射中的透镜状类星体鉴定
本研究使用卷积神经网络和深度学习管道自动检测强透镜效应,并在多波段图像中检测到了可以用于光谱学确认的 161 个候选源。
- 神经网络有限角度断层成像的拉伸正弦图
本文提出了一种使用卷积网络进行有限角度层析重建的直接方法,并通过最小化均方误差来训练网络以获得更好的三维重建效果。
- 通过多标签分类实现有效的口语语言识别
本文主要讲述了如何利用卷积神经网络构建高效的口语语种识别模型,并在训练时采用多标签的方式来应对非目标语种的识别,实验结果表明,该模型相比当前最先进的方法在速度上有数量级的提升,并且在多标签分类任务中更加稳健。
- 卷积神经网络分类中的自动学习算法选择
本文介绍一种基于元学习的分类器自动选择算法,通过使用卷积神经网络直接学习表格数据的内在结构,来提高二元分类的性能,并在模拟和真实数据集上实验证明,这种方法优于基于元特征的传统两步方法。
- 基于像素数据的预测:来自 PDE 和有限差分的洞见
为了更好地理解神经网络对序列近似的精度和成本,本文针对序列近似任务,通过利用离散卷积和有限差分算子之间的联系,构造可以在保证性能的情况下,具有与实践中常用的序列近似任务的相似性的小型卷积神经网络,本文的理论结果得到了数值实验的支持。
- 使用采样和精炼网络从单张图像生成 3D 人类 Avatar 的纹理
本文提出了一种基于几何信息的 3D 人形头像纹理合成方法,该方法使用了两个卷积神经网络来填充源图像的遮挡区域、与目标 3D 网格表面对齐,并逐步学习以辅助实现此目标的课程学习机制,实验结果表明其在 qualitatively 和 quant - 3D 脑部瘤分割的 3D 融合 Transformer
该研究提出了一种基于 3D Transformer 的分割方法,采用无限可变形融合 Transformer 模块 (IDFTM) 和融合头自注意机制 (FHSA) 提取 MRI 图像的长程空间依赖关系特征,通过在公共数据集中对脑肿瘤的分割实 - 基于标签引导的车道线分割注意力蒸馏
本文提出一种基于标签引导的注意力蒸馏方法(LGAD),用于训练分割网络以更好地捕捉诸如车道标记之类的长程上下文信息。通过将标签结构信息嵌入教师网络中,并利用其注意力图作为学生网络的监督信号,能够显著提高学生网络的训练效果。
- ICLR点集图像
本文介绍了一种新的视觉表示范式 - 环境群聚 (Context Clusters),可通过简化的聚类算法在一组未组织的点中提取特征,无需卷积或注意力机制,并提供了可视化聚类过程的令人满意的可解释性。在几个基准测试中,Context Clus