- KDD基于学习到的广义测地线距离函数的图节点特征增强方法
利用学习到的广义测地距离函数, LGGD 方法在图像处理、计算机图形学和计算机视觉领域中应用广泛,其在节点分类任务中具有改进的性能,并在真实图数据集上达到与最先进方法相竞争的结果,同时还展示了参数在图中广义测地方程中的可学习性以及新标签的动 - 前列腺超声图像处理方法综述
通过对前列腺癌患者进行超声影像处理及诊断的综合分析,本文总结了图像处理方法在超声影像分析中的演变,并强调了其相关贡献,同时讨论了目前的挑战和未来的研究方向。
- 人类感知和视觉颜色差异的色彩模型比较分析
本研究通过对 RGB、HSV、HSL、XYZ、CIELAB 和 CIELUV 等多种颜色模型进行比较分析,评估它们在准确反映人类感知颜色方面的有效性,从而评价它们在准确反映视觉颜色差异和与人眼兼容的主导调色板提取方面的能力,以便应用于图像处 - 层次神经网络、p - 适应性的偏微分方程及其在图像处理中的应用
介绍了一种新类型的带延迟的 p-adic 反应扩散细胞神经网络,并研究了这些网络的稳定性和它们的响应的数值模拟。同时,对 p-adic 细胞神经网络及其在图像处理中的应用进行了快速回顾。
- 基于 PRISMA 的公开数据集系统性回顾:用于工业缺陷检测的基准与模型开发
近年来,质量控制领域不断利用视频摄像和图像处理集成来进行有效的缺陷检测。然而,开发和改进自动缺陷检测模型所需的带有注释缺陷的全面数据集稀缺,阻碍了进展。本系统性综述涵盖 2015 年至 2023 年,鉴别 15 个公开可用的数据集并对其进行 - 基于图像处理的森林火灾检测
使用图像处理技术提出了一种新颖的森林火灾检测方法,该方法使用基于规则的颜色模型进行火焰像素分类,其中使用了 RGB 和 YCbCr 颜色空间,并采用标准方法测试算法性能,结果表明该方法具有更高的检测率和较低的误报率,可用于实时森林火灾检测。
- 脉冲耦合神经网络在计算机视觉和图像处理中的应用综述
该论文回顾了受哺乳动物视觉皮层启发的神经模型研究,重点介绍了脉冲耦合神经网络(PCNN)的数学形式、变体和文献中的其他简化方法,并提出了在图像处理和计算机视觉领域的多个应用,包括图像分割、边缘检测、医学成像、图像融合、图像压缩、物体识别和遥 - Eddeep: 深度学习快速修正扩散磁共振成像中的涡流失真
通过深度学习应用于图像处理与注册模型,我们提出了一种新的方法以降低扭曲对扩散磁共振成像的影响,实现实时预处理,促进其在临床上的广泛应用。
- 基于 CNN 编码器 - 解码器框架的压缩图像字幕生成
我们的项目旨在通过开发结合卷积神经网络(CNN)和编码 - 解码模型的自动图像字幕架构来解决图像字幕的挑战。我们还进行了性能比较,研究了多种预训练 CNN 模型的性能变化,并探索了频率正则化技术在压缩 “AlexNet” 和 “Effici - 极低能见度条件下非均匀照明图像增强
通过自适应滤波、可视化优化策略和最大直方图均衡化,本文介绍了一种在极低能见度下增强图像清晰度的新方法,并且在极低能见度条件下优于现有算法。
- 基于条件扩散模型的三模态医学图像融合和超分辨率
我们提出了一个同时实现三模态医学图像融合和超分辨率的 TFS-Diff 模型,该模型基于扩散模型生成随机迭代去噪过程,提出了简单的客观函数和融合超分辨率损失方法,通过通道注意模块有效地集成来自不同模态的关键信息,大量实验证明 TFS-Dif - 审视天空数据:基于区域交通环境的真实性研究
DFS 工具在异质和以区域为基础的交通流动方面的验证结果准确度较高,但在其他数据收集配置中存在明显错误,主要原因是交通组成的差异、摄像机视角和交通方向的影响。
- 通过解开图像的外貌与内容之间的关系,进行联合质量评估和示例引导的图像处理
通过深度学习技术和分解表示学习方法,该研究提出了一种新的质量预测模型 DisQUE,并展示了其在图像处理任务和 HDR 色调映射中的应用。
- In-Context Translation: 走向图像识别、处理和生成的统一化
我们提出了一种称为 In-Context Translation (ICT) 的通用学习框架,用于统一视觉识别、图像处理和条件图像生成。ICT 通过统一减少了特定任务模型设计所带来的内在归纳偏差,并最大程度地增强了相似任务之间的相互促进。在 - 扩散模型与遥感相遇:原理、方法和展望
扩散模型在遥感领域具有巨大潜力,在图像处理方面取得了重要进展。该研究对扩散模型在遥感领域的应用进行了全面回顾,涵盖了图像生成、增强和解释等方面,并对现有模型的局限性与进一步研究方向进行了探讨和总结。
- 无需重新训练的鱼眼相机卷积神经网络适应
通过提出 Rectified Convolutions (RectConv) 方法,不需要任何重新训练即可将预训练卷积网络适应于新的非透视图像,从而实现对两个公开数据集中的鱼眼图像进行分割和检测。
- 用快速傅立叶变换进行句子 Transformer 向量数据库的降维
该论文研究了将快速傅里叶变换(FFT)应用于降维方法在向量数据库管理中的潜力。通过在不同领域中展示其实用性,包括检索增强生成(RAG)模型和图像处理,该基于 FFT 的方法承诺提高数据检索过程的效率并增强人工智能解决方案的可伸缩性和效率。与 - LIPT:时延感知图像处理 Transformer
本文提出了一种低延迟的图像处理 transformer,名为 LIPT,通过使用自注意力和卷积的组合来替代内存密集型运算符,以实现实用的加速。在多个图像处理任务上进行的广泛实验表明,LIPT 在延迟和 PSNR 方面均表现出优越性,实现了多 - TGGLinesPlus: 鲁棒的拓扑图引导计算机视觉线条检测算法
图像处理、计算机视觉和机器智能等领域中的一种经典而重要的问题是线条检测。在本文中,我们提出并实现了一个名为 TGGLinesPlus 的拓扑图导向算法,用于线条检测。我们的实验证明了 TGGLinesPlus 算法的灵活性,并与其他经典和最 - 基于灰度重新定义的高分辨率图像转换模型
提出了一种创新的图像翻译方法,包括利用灰度调整方法进行像素级翻译、利用 Pix2PixHD 模型以及改进的损失函数来增强图像翻译性能,解决了稀疏训练数据的问题。