- MM自我监督和少样本学习在稳健生物气溶胶监测中的应用
实时生物气溶胶监测利用自监督学习和少样本学习,通过大量未标记数据和很少的样本来分类全息图像,从而优化监测工作流程并减少模型适应不同情况所需的努力。
- MpoxSLDNet:一种新型 CNN 模型用于检测猴痘病变及与预训练模型性能比较
介绍了一个名为 MpoxSLDNet(Monkeypox Skin Lesion Detector Network)的卷积神经网络模型,用于早期检测和分类数字图像中的天花病毒皮损和非天花病毒皮损,并相比传统预训练模型如 VGG16、ResN - BraTS-Path 挑战赛:评估非均质组织病理性脑肿瘤亚区
BrATs-Path 挑战的主要目标是为开发和公平比较能够识别具有不同组织学特征的肿瘤亚区的深度学习模型提供系统准备的完整数据集和基准环境,以进一步了解该疾病并以一致的方式协助诊断和分级。
- DeepDamageNet: 使用卫星图像的多灾害建筑损坏分割和分类的两步深度学习模型
通过深度学习模型,在 xView2 挑战中取得了 0.66 的 F1 分数,超过 0.28 的挑战基准分数,发现不同损伤等级和不同灾害类型之间的视觉相似性和损害分布差异导致建筑物损伤分类是一项困难任务,可能需要具备关于灾害损害的概率先验估计 - 克服神经网络深度学习模型在胶质母细胞瘤翻译中的挑战:ZGBM 联盟
报告了常规治疗中的脑胶质母细胞瘤患者的影像协议和调度的差异,以展示在脑胶质母细胞瘤治疗路径中整合深度学习模型的挑战。此外,还分析了最常见的影像研究和图像对比,以便为开发可能稳健的深度学习模型提供信息。
- 通过图像量化线虫:深度学习的数据集、模型和基准
对植物寄生线虫检测的深度学习模型进行研究和分类,提供了潜在的最先进的物体检测模型、训练技术、优化技术和评估指标,为初学者提供了一个基线,用于植物寄生线虫检测。
- 利用用户辅助的滤波估计和选择构建脑肿瘤分割网络
脑肿瘤图像分割是一个具有挑战性的研究课题,深度学习模型呈现出最佳结果。然而,传统的从许多预注释图像中训练这些模型的方式还存在一些未解答的问题。因此,方法学,例如从图像标记学习特征 (FLIM),已经在学习循环中涉及专家,以减少数据注释的人力 - 基于 PET 扫描图像分析的阿尔茨海默病早期检测的集成方法引介
通过对 ADNI 数据集所得的 PET 扫描图像进行深入研究,本文使用了 VGG16、AlexNet 和一个自定义的卷积神经网络(CNN)模型来将阿尔茨海默病分类为控制正常组(CN)、进展性轻度认知障碍组(pMCI)、稳定性轻度认知障碍组( - 提升社交机器人对受控与自然人机交互的视觉感知
社交机器人使用视觉感知来理解用户和环境,本研究使用深度学习模型改进了社交机器人的视觉感知功能,并通过实验评估了该功能对用户交互性能和体验的影响。
- 儿童语音的原始超声图像自动分级分类
自动检测语音障碍的提升方法:利用超声舌头成像技术结合深度学习模型,在语音障碍的分类中取得了显著的改善结果,并有助于提高语音治疗诊所中的超声舌头成像分类的效率。
- ACLVlogQA: 越南口语问答的任务、数据集和基线模型
通过捕捉越南母语者在自然环境中的口语表达,这篇论文描述了一个用于机器阅读理解任务的越南口语语料库的开发过程,并提供了使用真实数据进行机器阅读理解任务所面临的挑战和机遇的见解。
- 热图像校准和修正的非配对循环一致对抗网络
本文介绍了一种提高当前航拍野火数据集质量的方法,旨在适应相机技术的进步,并提出了一种基于 CycleGAN 的流程以及一种新颖的融合方法,通过将配对的 RGB 图像作为属性调节器集成到两个方向的生成器中,从而提高了生成图像的准确性。
- 无人机实时人体检测
本研究提出了一种适用于无人机热红外图片和视频的目标检测框架,基于 CNN 架构的 YOLO 模型,通过定量和定性评估深度学习模型,在人的交叉检测性能方面展示了 YOLOv7 模型在不同无人机观察角度下的应用。
- 甲床毛细血管分析的综合数据集和自动化处理流程
通过构建一个包含 321 张图像、219 个视频、68 个临床报告和专家注释的综合数据集,本研究在自动检测和测量不同形态和动态特征方面提出了一个端到端的指甲周状管分析流程,并展示了亚像素测量精度和 90% 的异常预测准确率,从而为推动定量医 - 从整体分数标签学习预测各种美学属性集的分数
使用 F2S 模型和属性特征,本文提出了一种替代图像属性标签的美学属性评估框架,能够在不使用经验丰富的艺术家和专业摄影师进行标注的情况下学习得出有意义的美学属性分数。
- 关于无监督表示学习对心音信号的防止跨领域鲁棒性研究
应用对比自监督学习方法,以及音频增强技术,通过学习泛化的心音图信号表示,检测心音图样本中的异常情况,并在多个数据集上进行了广泛的评估,证实了对比自监督学习方法可以提供具有鲁棒性的分类器,能够在未见过的数据上进行泛化,而无需专家进行耗时耗力的 - 一种适用于半监督医学图像分割的多功能范式
通过整合各种任务到一个统一模型并利用大量未标记数据来进行半监督医学图像分割,我们介绍了一个名为 VerSemi 的全新的多功能半监督框架,实验证明它在公共基准数据集上始终可以通过较大的边际优势(例如,在四个数据集上平均达到 2.69%的 D - 基于情感计算的体验质量(QoE)预测的新方法
提出了一种基于情感计算驱动的体验质量(QoE)预测的新模型,使用多通道脑电图(EEG),心电图(ECG)和呼吸数据训练深度学习模型,比较了模型的性能,并对最佳模型进行了优化以提高结果。
- 卷积神经网络中通过激活稀疏性出现的形状偏差
稀疏编码通过非可微的 Top-K 操作实施了对网络的结构编码,使得卷积神经网络中的神经元能够对物体进行部分和亚部分的平滑分解,并赋予网络形状偏差。
- S$^3$-TTA: 生物医学图像分割中的规模样式选择
该研究论文提出了一种名为 S$^3$-TTA 的新的测试时间数据增强框架,基于转换一致性指标为每个测试图像选择合适的图像尺度和样式,同时构建了端到端的增强 - 分割联合训练流水线,通过在测试阶段简单增加输入数据,在细胞和肺部分割的公共基准上