- 基于 2D 街景图像的电线杆火灾风险检查
通过利用计算机视觉技术,在加州电力网络中借助谷歌街景图像识别电线杆和评估与周围植被的距离以及倾斜角度,这项研究提供了一个全面的框架,重点关注易燃的电线杆,以防止野火起火并做出战略投资决策来加强电力网络的韧性。
- 计算机视觉用于自动蜜蜂计数应用的方法
通过计算机视觉技术对蜜蜂群的健康状态进行监测,本研究比较了三种自动蜜蜂计数方法,并发现基于 ResNet-50 卷积神经网络分类器的算法在 BUT1 和 BUT2 数据集上分别达到了 87% 和 93% 的准确率。
- 增强物理学:一种利用机器学习技术从静态图示中创建交互性物理仿真的工具
我们介绍了增强物理学,一种利用机器学习技术从静态教科书图表中创建交互式物理模拟的工具。通过计算机视觉技术,如分割任何物和 OpenCV,我们的基于 Web 的系统使用户能够半自动从物理教科书中提取图表,然后根据提取的内容生成交互式模拟。这些 - 基于视觉的食物重量估算方法
该研究提出了一种基于视觉的方法,利用 2D 图像来估计食物重量,采用深度学习和计算机视觉技术,使用 Faster R-CNN 进行食物检测和 MobileNetV3 进行重量估计,该方法在提供准确食物重量估计方面表现出强大的能力,并可用于医 - 水滴污染对透明度分割的影响
本研究评估了透明物体与环境干扰(如水汽)共同作用的组合,并引入了一个包含 489 个图片的新型公开数据集,检查了透明性处理的结果对透明物体的污染程度的影响。我们的研究表明,被污染的透明物体更容易被分割,并且我们能够利用当前最先进的机器学习模 - 利用计算机视觉和 LSTM 网络分析和预测太阳冕空洞
使用计算机视觉技术检测太阳上的日冕洞区域并估计其大小,利用深度学习方法分析日冕洞面积的趋势,并预测未来七天不同太阳区域中日冕洞的面积。通过研究时间序列数据,希望找出日冕洞行为的模式,并了解其对太空天气的潜在影响,以提高我们预测和应对可能影响 - 通过图像量化线虫:深度学习的数据集、模型和基准
对植物寄生线虫检测的深度学习模型进行研究和分类,提供了潜在的最先进的物体检测模型、训练技术、优化技术和评估指标,为初学者提供了一个基线,用于植物寄生线虫检测。
- 提升腹腔镜解剖分割模型在实际应用中的适用性战略
通过分析类别特征、训练和测试数据的组成以及建模参数对八个分割度量指标的影响,本研究提出了两种简单而有效的策略来改善腹腔镜手术数据中图像分割模型的实际适用性:(1)在训练过程中包含负样本,(2)调整分割模型的前景 - 背景权重以最大化与特定感 - 时尚图像编辑的多模态条件化潜扩散模型
该论文探讨了多模态条件下的时尚图像编辑任务,提出了一种基于多模态指导的生成方法,利用时尚设计的文本、人体姿势、服装草图和面料纹理等多模态提示生成以人为中心的时尚图像。实验证明了提出方法在现实感和一致性方面的有效性。
- 实现实际 3D LiDAR 场景补全的扩展扩散模型
使用扩散模型方法在单个 3D LiDAR 扫描中完成场景实现了比最先进的完成场景方法更多细节的场景,为扩散模型应用于场景规模点云数据的进一步研究提供了支持。
- 硬件受限设备和计算机视觉中光伏电池的微裂缝检测
开发系统使用计算机视觉技术检测太阳能电池板的裂缝,以提前预测和警示光伏系统的潜在故障。
- 哈利斯:一种先进的自主移动机器人用于智能停车辅助
该研究论文介绍了 Haris,一种先进的自主移动机器人系统,用于利用车牌识别在拥挤的停车场中跟踪车辆位置。该系统采用自主定位和地图绘制(SLAM)进行自主导航和停车区域的精确绘制,消除了对全球定位系统(GPS)的依赖。此外,该系统利用计算机 - 基于 YOLOv5 的昆虫三维绘图算法
本研究开发了一种简单且廉价的三维昆虫监测算法,利用廉价相机和其他设备设计了一个深度误差调整算法,通过提供昆虫的详细三维可视化,该绘图算法有助于研究人员更有效地理解昆虫在其环境中的互动。
- AAAIUV-SAM:适应城中村识别的分割模型
利用计算机视觉技术识别城市村庄边界,发现城市村庄数量和面积随时间减少,为可持续城市发展趋势提供深入洞察,并为视觉基础模型提供指导。
- 通过编码器 - 解码器模型实现珠宝识别
利用计算机视觉技术和图像字幕的方法进行珠宝识别,通过生成自然语言描述,将珠宝进行分类,然后利用此方法准确识别不同类型的珠宝,并具有在珠宝电子商务、库存管理或自动珠宝识别等应用中的潜力。
- 基于卷积深度学习模型的混凝土表面裂纹检测
本论文采用各种深度学习模型,如 VGG19、ResNet50、Inception V3 和 EfficientNetV2,在表面裂缝检测上进行了精细调整,并通过精确度、召回率和 F1 得分进行了比较。
- 前、主动、和后火灾管理中人工智能驱动的无人机系统的综合调查
利用人工智能 (Artificial Intelligence) 和无人机 (Unmanned Aerial Vehicles) 技术,系统地综述了野火管理领域的最新技术,并重点讨论了无人机在火前、火中和火后阶段对野火的监测、管理和预测的作 - 孟加拉车牌识别:用卷积神经网络和 GFP-GAN 揭示清晰度
自动车牌识别(ALPR)是一种利用图像处理和计算机视觉技术自动读取和提取车辆车牌数据的系统。该方法包括处理孟加拉低分辨率模糊的车牌并识别车牌字符,通过图像恢复、对比度最大化、形态学图像处理、卷积神经网络进行特征提取、字符分割和识别。为该项目 - Nahid:用于全自动手术操作的基于人工智能算法
首次提出了一种基于软件和计算机视觉技术的完全自动化手术方法,通过检测卵巢子宫内膜异位症疾病的手术相关性,提出了一种更详细的算法,证明了我们提出的方法的可行性,其中使用 U-net 在手术过程中检测子宫内膜异位症。
- 将像素转化为杰作:使用一种新型分布式去噪卷积神经网络(DDCNN)实现基于人工智能的艺术修复
本研究论文提出了一种使用深度学习,特别是卷积神经网络(CNNs),与计算机视觉技术相结合的创新方法来革新艺术修复领域。通过创建多样化的退化艺术图像数据集,我们训练了一个分布式去噪卷积神经网络(DDCNN),该网络能够去除失真并保留复杂的细节