隐式长程传播内部视频修复
通过在卷积神经网络中引入切削条件作为额外的模型输入,本研究提出了一种基于深度学习的方法,旨在提高刀具磨损估计的准确性,并满足工业对零射击传递能力的需求,通过一系列铣削实验评估模型的性能,结果一致强调我们方法的优势,无论磨损发展的稳定性还是训练数据集的限制如何,其性能都优于省略切削条件的传统模型,这一发现凸显了其在工业场景中的潜在应用性。
Jul, 2024
使用现成的单目视频生成模型,我们提出了一种无姿态、无需训练的方法来生成 3D 立体视频,并采用了新颖的帧矩阵视频修复框架。我们的方法利用估计的视频深度将生成的单目视频变形为立体基线上的摄像机视图,并使用视频生成模型对观察到的不同时间戳和视图的帧进行修复。通过减轻潜在空间中从不可遮挡区域传播的负面影响,我们还开发了一种去遮挡边界再注入方案来进一步提高视频修复的质量。我们对包括 Sora、Lumiere、WALT 和 Zeroscope 等各种生成模型的视频进行了实验证明我们提出的方法在之前的方法基础上具有显著的改进。
Jun, 2024
该论文介绍了一种方法,通过在计算机上训练 CNN 模型并将优化的权重矩阵传输到 AR 头戴设备,以在 AR 头戴设备上部署 CNN 模型。该方法将图像数据和 CNN 层转换为适合 AR 平台的一维格式,在 HoloLens AR 头戴设备上使用 PyTorch 训练 LeNet-5 CNN 模型并部署,结果表明模型的准确率约为 98%,与在计算机上的表现相似。这种 CNN 和 AR 的结合使得 AR 头戴设备能够实时进行图像处理,实现了人工智能模型与人的交互。
Jun, 2024
使用深度学习方法自动化检测疟疾感染细胞,通过 ResNet50 卷积神经网络模型和训练集 27,558 张分为感染和未感染细胞的 Malaria Cell Images Dataset 的转移学习,实现高准确率、精确度和召回率,证明其在疟疾诊断中的潜力,且开发了 Streamlit 的网络应用以提供上传细胞图像和接收疟疾感染预测的用户友好的技术。
Jun, 2024
DwinFormer 是一个层级编码器解码器架构,具有方向窗口(Dwin)注意力和全局自注意力(GSA)用于特征编码,通过在水平、垂直和深度方向分别执行注意力,在输入特征图的这些方向体积中有效地捕捉局部和全局信息,实验证明它在医学图像分割方面优于当前最先进的方法。
Jun, 2024
利用基于卷积神经网络 (CNN) 的 QuasarNET 模型和数据增强技术,本研究通过确定 Laman Break Galaxies (LBGs) 是否是 LBGs 以及通过红移确定它们与地球的距离,进而将这些星系放置在 DESI 的 3D 地图上,提高模型性能并实现了高达 94% 的平均得分。
Jun, 2024
我们提出了一个使用卷积神经网络对鲫鱼心脏进行自动分割的新框架,该框架可以推断出样本的三维分割,从而避免了三维卷积神经网络的高计算成本,并且可以显著减少新样本分割所需的时间,实现对高分辨率鲫鱼心脏形状的快速微增强分析。
Jun, 2024
通过深度学习评估血管衰老表现的 Photoplethysmography (PPG) 成为监测人体血液动力学的关键工具,本文在实证研究中介绍了名为 Dist Loss 的新型简单有效的损失函数,以解决深度不平衡回归任务的挑战,并在大规模的 UK 生物银行数据集上训练了一维卷积神经网络(Net1D),使用 PPG 信号估计血管年龄,验证了其在刻画心血管健康方面的功效,结果表明预测的血管年龄能够显著反映个体的心血管健康状况。
Jun, 2024
内部孤立波是重力波,通常在海洋内部而非表面观测到。本研究提出基于测高仪的机器学习解决方案,自动定位内部孤立波,并通过深度学习和卷积神经网络等方法提高性能。
Jun, 2024