- Hermite 坐标插值核函数:图像缩放应用
基于 Hermite 样条插值的图像缩放方法在 PSNR 和 SSIM 误差度量方面优于传统卷积和深度学习方法,适用于多数测试图像和级联重复的缩放操作。
- 从野外面部图像中的年龄和性别分类的混合 Transformer-Sequencer 方法
该论文旨在通过结合自注意力和双向 LSTM 方法,提出了一个混合模型来解决年龄和性别分类问题,并与现有的先进模型进行对比,结果显示该模型在年龄和性别分类方面分别比先前的模型提高了约 10% 和 6%,表现更好,具有更广泛的学习能力,可应用于 - Pix2Pix-OnTheFly:借助 LLMs 实现指导图像编辑
该研究论文通过语言处理和图像处理的组合吸引了越来越多的关注,其中一项最具挑战性的任务是仅基于自然语言指令对图像进行编辑。本论文提出了一种无需准备的方法,通过图像字幕和 DDIM 反演、获取编辑方向嵌入以及图像编辑等三个步骤有效地进行指令引导 - 卷积神经网络用于人脸皮肤病变检测
该研究提出了一种通过卷积神经网络和机器学习方法,在面部图像中侦测瑕疵和皮肤损伤的模型,该方法具有简单的架构、快速和适用于图像处理,并避免了传统方法的复杂性。
- 一种胶囊内镜图像高光去除方法
本文提出了一种适用于胶囊内窥镜图像的去除高光区域的方法,通过计算高光区边缘的置信度和特征项,确定优先级,使用最佳匹配块在已知区域内复制像素,从而实现去除高光区域并保持颜色和纹理连续的目标。实验结果表明,该方法有效地去除了胶囊内窥镜图像中的高 - 深度估计和语义分割的混合网络
通过混合卷积网络从单个输入图像中同时解决深度估计和语义分割两个重要任务,改善了特征提取过程,实验结果表明 HybridNet 的性能与最先进方法以及其基于的单任务方法相当。
- 生成对抗网络中 FID 和 SID 指标的评估
使用公共数据集对图像处理中的生成对抗网络(GAN)模型进行训练和评估,发现使用 SID 指标能够有效衡量模型的生成性能,超过或者与使用 FID 指标相当。
- 通过超分辨率技术提高足球中物体检测质量
本文研究探讨了在足球领域中,超分辨率技术提高物体检测准确性的潜力。研究发现,在处理足球比赛录像时,应用先进的超分辨率图像处理技术对物体检测算法的准确性和可靠性有显著提高。通过综合性能评估,结果表明超分辨率预处理可以显著提高物体检测的准确性, - ImageLab:为初学者和专家简化图像处理探索
这篇论文介绍了一种名为 “ImageLab” 的新型工具,旨在通过优先考虑交互式学习而不是理论复杂性,填补技术专家以外的用户之间的知识差距,从而使图像处理更加平等、可靠。该工具不仅作为有价值的教育资源,还提供了一个实践环境供经验丰富的从业者 - 鱼眼相机畸变校正方法的全面综述
鱼眼相机的畸变修正方法进行了综述,包括多项式畸变模型、全景映射、网格映射、直接方法和基于深度学习的方法。文章强调了每种方法的优点、限制和最新进展,以帮助读者根据自己的具体需求做出明智的决策。
- 利用 LogSumExp 逼近进行色彩形态学最大值生成的方法
本文提出一种新颖的基于 Loewner 顺序的彩色形态学方法,通过 Maslov 引入的对数和指数的对数求和来逼近最高点,将 RGB 图像嵌入到对称 $2 imes2$ 矩阵中,得到代表颜色的几乎各向同性矩阵和传递性的结构优势,并通过数值实 - 孟加拉车牌识别:用卷积神经网络和 GFP-GAN 揭示清晰度
自动车牌识别(ALPR)是一种利用图像处理和计算机视觉技术自动读取和提取车辆车牌数据的系统。该方法包括处理孟加拉低分辨率模糊的车牌并识别车牌字符,通过图像恢复、对比度最大化、形态学图像处理、卷积神经网络进行特征提取、字符分割和识别。为该项目 - 利用切片处理技术和修改后的 Xception 分类器从计算机断层扫描图像中检测 COVID-19
通过对计算机断层扫描图像进行增强处理,本研究提出了一种改进的方法来检测 COVID-19,结果显示相较于同一数据集上之前的方法和其他替代方案,在切片和患者层面上,所采用的 Xception 迁移学习模型在 COV19-CT 数据库上取得了更 - 一种具有线性 - SVM 的测压特征描述符,用于区分食管收缩力量
利用图像处理技术对高分辨食管测压进行分析,预测食管收缩力量以辅助评估食管动力功能,并通过机器学习方法实现对食管收缩力量的分类,准确率达到 86.83%,高于其他常见机器学习方法。
- 优化文化打字文件字符识别图像处理算法
利用多目标问题公式和非支配排序遗传算法(NSGA-II)调整参数,本文评估了在光学字符识别(OCR)应用于打字文化遗产文件时图像处理方法和参数调整的影响,并发现通过数字表示类型来针对图像预处理算法进行参数化可以提高 OCR 的性能。特别是自 - 优化的 AUV 海底图像分析深度学习模型
使用自主水下航行器,特别是在图像分析方面的创新,以提高准确率和效率,彻底改变了我们从海底获得数据的方式。本文总结和比较了 AUV 海底图像处理中最新的进展,涵盖了从计算机和算法进展到传感器和相机的海洋技术领域。通过阅读本文,您将对使用 AU - 125 FPS 下约 8K 参数的 4K 分辨率照片曝光校正
通过使用非常轻量级(仅有约 8K 个参数)的多尺度线性变换(MSLT)网络,我们提出了一种能够以每秒 125 帧比特率处理 4K 分辨率 sRGB 图像的照明校正方法,该方法能够有效降低参数量和计算复杂度。
- 具有二维旋转嵌入的交叉轴变压器
介绍了 Cross-Axis Transformer (CAT) 模型,该模型通过减少浮点运算数量,在图像处理中比 Vision Transformers 更快、更准确地收敛,从而解决了 Vision Transformers 在计算效率和 - 基于深度神经网络的通用嵌入式硬件入口流量估计
使用图像处理和机器学习方法,基于边缘检测的实时交通强度估计系统在树莓派单板计算机上实现,为大规模部署提供了经济有效的解决方案。
- 利用 ProbSom 识别阿根廷手语的手势形状
自动手语识别是人机交互和机器学习领域的重要课题之一,本文的主要贡献是创建了阿根廷手语的手指形状数据库,并提出了一种基于图像处理和 ProbSom 的手指形状分类技术,实验结果表明该技术的精确率超过 90%。