- 图像综合的观察条件集成
本文介绍了一种整合视点信息以增强图像处理任务控制的开创性框架,通过对现有对象编辑方法的调查,提炼出一种图像编辑方法应满足的三个关键标准:一致性、可控性和协调性。与以往方法相比,我们的方法在满足所有三个要求方面处于领先地位,通过全面的实验,在 - 高效 COVID19 检测中释放改进的深度学习模型
COVID19 预测和检测的深度学习方法在此研究中得到了改进,并且高精度的预测模型可为医疗系统、决策者和研究者做出准确决策以减少 COVID-19 及其它传染病。
- 手写文档的非破坏性检验创新方法
通过图像处理和深度学习技术,本文提出了一个能够提取和分析手稿文档与文本行高度、单词间距和字符大小相关的内在度量的框架。通过量化待比较文档的特征向量之间的欧几里德距离,可以辨别出作者身份。我们还提出了一个新的、具有挑战性的数据集,包括 124 - 将图像处理统一为视觉提示问题回答
我们提出了一个名为 PromptGIP 的通用模型,通过视觉提示式问答范式统一了多样化的图像处理任务,消除了特定任务微调的需求。该方法提供了通用且适应性强的解决方案,可用于图像处理中的跨领域任务,包括图像恢复和图像增强。
- 在嘈杂环境下使用差异度量的量子经典混合块匹配算法
通过使用分块匹配算法和相似度 / 不相似度测量,本研究在图像处理过程中,利用高斯噪声和图像大小减小的低通滤波器或域转换,并采用分阶段搜索技术通过相位操作符对图像进行编码。通过量子傅里叶变换和 Swap 测试对相位图像编码进行相似度度量,结果 - 教育中的课堂出勤系统基于深度学习方法
在这项研究中,使用了深度学习方法进行图像处理,设计并成功实施了一项能够通过图像识别对学生进出校门记录并进行课堂考勤的创新研究,该研究将在 2022-2023 学年在一所学校进行实际应用。
- 学习动作和注意力焦点的控制与一个类似对数极坐标的传感器
在这篇论文中,我们探讨了使用类似于对数极坐标图像数据和凝视控制来减少自主移动机器人上的图像处理时间的长期目标。我们使用经典的深度强化学习方法和 LSTM 网络扩展了 A3C 深度强化学习方法,并训练出了三个 Atari 游戏的策略和凝视控制 - AI4Food-NutritionFW: 面向自动合成和分析饮食行为的新型框架
利用图像处理和人工智能的最新进展,本文提出了 AI4Food-NutritionFW 框架,用于根据可配置的饮食习惯创建食物图像数据集,并通过多维度指标评估个体的饮食行为健康指数,取得了令人期待的结果。
- MM从单个校准图像中的上下文感知三维物体定位:篮球的研究
本文提出了一种从单个校准图像中实现三维篮球定位的新方法,通过预测对象在图像空间中的像素高度,并利用图像本身和对象的位置作为输入,估计其在图像中投影到地平面上,并利用已知的投影矩阵重建篮球的三维坐标,实验结果表明该方法相对于最近的研究取得了显 - 土壤采样点最佳选择的深度学习框架
通过利用深度学习在图像处理方面的最新进展,本研究提出了一种基于自注意力机制的编码 - 解码架构模型,用于自动选择土壤采样点,并在土壤采样数据集上实现了优于传统卷积神经网络方法的令人印象深刻的结果。
- 神经梯度正则化器
我们提出了一种神经梯度正则化器 (NGR),将梯度图表达为神经网络的输出,避免了梯度图的低估,具有广泛的适用性和插拔式功能。
- ICCV通道选择性归一化的广义亮度调整
本文提出了一种新的广义亮度适应算法,通过通道选择性归一化(CSNorm)的设计,有针对性地标准化与亮度相关的通道的统计数据并保持其他通道不变,以提高特征的泛化能力和区分度。实验结果表明 CSNorm 在增强现有亮度适应方法的泛化能力方面具有 - 基于初始 CT 扫描的深度学习模型增强颅内出血患者死亡率预测
使用基于卷积神经网络的算法通过处理初始 CT 扫描图像,能够以高准确度预测蛛网膜下腔出血患者的死亡率。
- ICCV基于分层区域的多实例学习中的 Transformer
我们提出了一种基于 Transformer 的多例学习方法,用区域视觉 Transformer 自注意机制替代传统的学习注意机制,通过融合区域块信息来预测整张幻灯片,并展示了如何在不同距离级别上分层处理特征。为了提高预测准确性,尤其是对于具 - R-C-P 方法:使用图像处理和机器视觉的自主体积计算方法
该研究使用图像处理和边缘检测开发了 R-C-P(行 - 列 - 像素)方法,结合给定的距离信息,利用多个 2D 相机实时测量矩形物体的尺寸,提供了计算表面积尺寸的方程。
- SA Unet 改进
该论文描述了一种新的方法,结合使用 StyleGAN2 和 SA-Unet,用于在医学领域中进行视网膜血管分割的图像处理,旨在帮助医生更好地诊断眼部疾病,并解决小数据集分割问题。
- 扫描电子显微镜图像中纳米粒子的递归检测与分析
本研究提出了一个针对扫描电子显微镜(SEM)图像的纳米粒子精确检测和全面分析的计算框架。该框架利用 Python 的强大图像处理能力,特别是利用 OpenCV、SciPy 和 Scikit-Image 等库,采用阈值处理、膨胀和腐蚀等技术提 - RoadScan: 一种新颖且稳健的自动驾驶道路坑洞检测的迁移学习框架
这篇研究论文介绍了一种使用深度学习和图像处理技术进行坑洼检测的新方法,提出的系统利用 VGG16 模型进行特征提取,并采用自定义的具有三重损失的 Siamese 网络(称为 RoadScan),以解决道路上的坑洼问题对道路使用者的重大风险。
- 道路病害识别中的深度学习方法:综述
综述最近图像处理和深度学习技术在道路病害检测和分类中的广泛应用,介绍了机器学习和深度学习算法在提高效率和准确性方面的优势,讨论了无人机数据采集的整合以及处理高分辨率图像的深度学习算法在有效检测和分类不同道路病害方面的价值。
- ICCV通向普适低光原始噪声合成与建模
通过使用生成模型来综合信号独立噪声,该方法可以同时学习不同 ISO 级别的噪声特性,并在各种传感器上进行泛化,通过傅里叶变换鉴别器准确区分噪声分布,验证结果显示该模型产生的噪声分布与实际噪声非常相似,对不同传感器进行去噪实验显示该方法在各个