- 基于多层特征的注意力机制三维卷积神经网络在脑图像中用于阿尔茨海默病诊断
本研究提出了一种基于 ResNet 的端到端 3D CNN 框架,结合注意力机制作用下获取的多层特征,以更好地捕捉脑部图像的细微差异,用于阿尔茨海默病的诊断。在 ADNI 数据库的 792 个受试者上进行了消融实验验证,基于 sMRI 和 - CVPR学习三维场景中的人体网格恢复
提出了一种新方法,通过使用稀疏的 3D CNN 估计场景的绝对位置和密集的场景接触,并通过与其相关的 3D 场景线索的交互关注来加强预训练的人类 mesh 回收网络的关节学习,进而提高每个正向遍历的准确性和速度。
- 深度学习在阿尔茨海默病诊断中的实际应用
本研究探讨将深度学习模型应用于阿尔兹海默病的诊断,使用 3D 卷积神经网络进行训练和测试,并设计了一个算法集成,能够优于任何单独算法,在超过 1500 个完整的脑部体积中展现出良好的分类性能和突出的诊断能力,这些算法具有成为软件包的潜力,能 - CVPR跨架构自监督视频表示学习
本文提出一种新的跨架构对比学习(CACL)框架,用于自监督视频表示学习,使用 3D CNN 和视频变换器并行生成对比学习中多样化的正对,同时引入了一个具有明确视频序列编辑距离预测能力的时间自监督学习模块,用于学习强大的时序性表示,在 UCF - 自监督学习平面波超声相位畸变鲁棒波束成像
本文提出了一种基于自监督三维 CNN 的超声相位象差稳健成像方法,通过建模声速变化为随机变量,该方法在 extit {in vivo} 扫描中显著减少了象差伪影并提高了深部扫描的视觉质量。
- 基于可变形卷积和粗到细的三维卷积神经网络提升视频帧插值
本研究提出了一种使用可变形卷积的视频帧插值方法,使用粗到细的 3D CNN 增强多流预测,实验结果表明,该方法的干涉性能优于其他现有算法,最高可以获得 0.19dB 的 PSNR 增益。
- CVPR使用时空卷积进行视频帧插值的非线性运动估计
本文提出了一种适应性选择运动模型的时空卷积网络来逼近像素间的运动。通过实验结果证实算法在四个数据集上的表现均优于现有算法,尤其是在处理非线性运动和运动不连续的情况下具有显著优势。
- 基于 Transformer 的多模态脑肿瘤分割
本文提出了使用 Transformer 和 3D CNN 实现 MRI 脑肿瘤分割的新网络 TransBTS。该网络同时利用全局和局部特征进行分割,并在 BraTS 2019 和 2020 数据集上取得了当前最高水平的分割效果。
- KDD半监督肺癌筛查的深度期望最大化
提出一种基于半监督学习和 3D 卷积神经网络的肺癌筛查算法,采用 Expectation-Maximization 元算法进行训练,通过交叉域的方法验证其模型性能,结果表明该算法能够极大地提高肺癌筛查的分类准确性,证明了半监督 EM 是改进 - 基于视频检索和特征生成的通用 Few-Shot 视频分类
本研究提出通过使用 3D CNN 学习视频空时特征并在基类上 fine-tuning 分类器来解决 few-shot video classification 问题,其表现超过现有基准测试的先前方法 20 点以上,同时提出了利用标签检索和生 - 一种用于高光谱图像分类的快速三维卷积神经网络
本论文提出了一种利用 3D CNN 模型用于 HSI 分类的方法,其利用了空间光谱特征图以实现良好的性能,并对其性能进行了实验验证。
- 医学影像的 3D 深度学习综述
本文回顾了 3D CNN 在医学图像分析中的应用历史及数学描述,并总结了不同领域中 3D CNN 的研究成果,如分类、分割、检测和定位,同时讨论了医学成像领域(以及深度学习模型的使用)中面临的挑战和未来趋势。
- CVPR基于 Actor-Transformers 的群体活动识别
本文提出一种基于 actor-transformer model 认知视频中的个人行为和组群活动的模型,并通过 2D 姿态网络和 3D CNN 等方式提供丰富的个人动态和静态信息表示,从而在公开数据集上取得了显著的效果。
- ICCV高效动作识别的组合空时聚合
本文提出一种名为 “grouped spatial-temporal aggregation” 的新型分解方法,将特征通道分解成空间和时间分组并在并行处理。实验证明,该方法在需要时序推理的动作识别任务上具有更加高效的性能。
- 一种高效的用于视频行为 / 物体分割的 3D 卷积神经网络
本研究提出一种基于卷积神经网络(CNN)的 3D 编码器 - 解码器风格方法来同时汇集空间和时间信息从而用于视频物体分割和视频行为分割,测试结果表明该方法比现有技术具有更高的性能表现。
- 发现时空动作管道
本文提出通过静态和运动信息的早期和后期融合检测和跟踪点匹配算法实现视频中时空动作检测,并使用递归 3D 卷积神经网络来预测并确定生成的动作分类和时间边界。通过引入动作足迹图以及 R3DCNN 卷积层中保留的特定空间特征来细化候选框,并在三个 - AAAI自监督空时立方体拼图视频表示学习
本文介绍了一项名为 “Space-Time Cubic Puzzles” 的自监督任务,通过完成此任务训练 3D CNN 以获取视频的空间与时间信息,并在 UCF101 和 HMDB51 数据集上实现比 2D CNN 更好的动作识别结果。
- ICCVTSM: 高效视频理解的时间位移模块
该论文提出了一种基于 Temporal Shift Module 的 2D CNN 模型,既具有 3D CNN 的性能又保持了 2D CNN 的计算复杂度,并将该模型扩展至在线设置中,实现实时低延迟的在线视频识别和视频对象检测。该模型在 S - S4ND:单次扫描单尺度肺结节数量检测
本文提出了一种基于深度学习和单个三维卷积神经网络的肺结节检测方法 S4ND,相较于当前文献在效率和准确性上都有明显提升,平均 FROC 得分为 0.897。
- 基于密集连接 3D 卷积神经网络的 MRI 肿瘤分割
本研究提出了基于 3D CNN 的新型分割网络对 Glioma 进行自动分割,该方法利用 MRI 数据帮助病灶分割,分类准确率较高,是一种有效和高效的病灶分割方法,可以帮助研究和评估 Glioma 的治疗效果。