动态图上的事件检测
本研究中,我们提出了一种基于实例的运动校正流程,利用运动引导的隐式神经表示来减轻运动伪影对解剖结构的影响,通过使用 NYU fastMRI 数据集对不同程度模拟的运动严重性进行评估,纯粹的校正方法可以将结构相似性指标(SSIM)提高 5%,峰值信噪比(PSNR)提高 5 dB,以及 HaarPSI 提高 14%,在随后的实验中,我们的方法相对于受运动干扰的图像,至少可以将分类准确度提高 1.5 个百分点以上。
Jul, 2024
使用深度学习方法改进传统的基于树的表格数据预测方法,并通过集成深度学习架构和邻域抽样策略,显著提高现代邻域组件分析的性能,超过了现代深度表格模型,在分类和回归任务中取得最先进的结果,同时减少训练时间和模型大小。
Jul, 2024
在工业 4.0 中,随着深度学习和智能制造的快速发展,高吞吐量、高性能和完全集成的视觉检测系统呼之欲出。我们的实验研究表明,多类模型在标准 MVTec AD 数据集上的性能与单类模型相当,进一步证明了当物体类别之间差异显著时,学习单独的物体 / 类别模型可能是不必要的。我们还通过在 CPU 和边缘设备(NVIDIA Jetson Xavier NX)上部署三种不同的统一轻量级架构来分析量化的多类异常检测模型在边缘设备上的延迟和内存需求,并比较了量化感知训练(QAT)和后训练量化(PTQ)在不同精度位宽下的性能。此外,我们探索了后训练场景中所需的两种不同的校准方法,并且表明其中一种性能明显更好,突出了它在无监督任务中的重要性。由于量化,PTQ 的性能下降通过 QAT 得到进一步补偿,在考虑的两种模型中,QAT 以与原始 32 位浮点数相当的性能呈现。
Jul, 2024
我们提出了一种新颖的生成方法用于组织病理学图像的领域泛化,通过使用一种生成的自监督视觉转换器从图像片段中提取特征,并将它们无缝地融合到原始图像中,从而创建具有不同属性的新颖的合成图像,丰富数据集,从而提高深度学习模型在未见领域中的泛化能力。
Jul, 2024
基于深度学习的 GMM-ResNext 模型结合语音特征和基于 ResNext 网络的说话人嵌入,通过将生成模型和判别模型相结合,提高了深度学习模型的泛化能力,也提出了基于两个性别相关的 GMM 的两通道 GMM-ResNext 模型。在 VoxCeleb1-O 测试集上,相比于 ResNet34 和 ECAPA-TDNN,提出的 GMM-ResNext 模型实现了 48.1% 和 11.3% 的相对改进。
Jul, 2024
深度学习在儿童尺骨骨折检测中的应用研究,通过 YOLOv8+GC 模型对 X 射线图像进行分析与诊断,提高了模型性能达到国际先进水平。
Jul, 2024
RCTNet 通过引入早期融合骨干网络、交叉阶段聚合模块、多尺度特征融合模块和高效自译注意力模块,以在准确变动检测中捕捉全局信息和细微细节,展示了相对传统遥感图像变动检测方法的明显优势,实现了准确性和计算成本之间的最佳平衡。
Jul, 2024
数字病理学领域的研究使用了全新的全景组织学(HoloHisto)分割方法,通过全景图像分割实现对吉千像素图像的端到端分割,大规模地提高了分辨率和模型性能,创造了新的肾脏病理图像分割数据集,分析结果表明该方法在性能上明显优于现有的先进模型。
Jul, 2024