欧氏和仿射曲线重建

MMJan, 2022

Euclidean and Affine Curve Reconstruction

Jose Agudelo, Brooke Dippold, Ian Klein, Alex Kokot, Eric Geiger...

TL;DR本文讨论和实现了重构具有规定欧几里得或仿射曲率的平面曲线的算法，并给出了在适当度量下，重构曲线与其曲率接近程度的估计。提供了几个说明性的例子。

Abstract

We consider practical aspects of reconstructing planar curves with prescribed Euclidean or affine curvatures. These curvatures are invariant under the special Euclidean group and the equi-affine groups, respectiv

planar curves euclidean curvatures affine curvatures computer vision shape analysis

发现论文，激发创造

科尔莫戈洛夫－阿诺德卷积：设计原则与实证研究

本文探讨了 Kolmogorov-Arnold Networks 在计算机视觉领域的应用，提出了参数高效的设计和微调算法，并在图像分类和分割任务中取得了最新成果。

Jul, 2024

GSO-YOLO: 建筑工地检测的全局稳定优化 YOLO

利用全局稳定优化 YOLO 模型 (GSO-YOLO) 解决复杂施工环境中的安全问题，并通过整合全局优化模块 (GOM) 和稳定捕获模块 (SCM) 以提高全局上下文信息的捕获和检测稳定性，以及创新的 AIoU 损失函数来提高检测精度和效率。实验结果表明，GSO-YOLO 在 SODA、MOCS 和 CIS 等数据集上表现优于现有方法，达到了 SOTA 水平。

Jul, 2024

快速高效：用于 3D 场景分割的掩模神经场

通过底层模型的信号转换，快速高效地进行弱监督下的 3D 场景分割。

Jul, 2024

深度图像至食谱翻译

深度图像到菜谱的翻译，是计算机视觉和自然语言生成的交叉领域，旨在弥合珍贵食物记忆与烹饪艺术之间的鸿沟。

Jul, 2024

稻草人监控系统：运用 MobileNet SSD 加强动物监督

通过机器学习、深度学习和计算机视觉技术，该研究旨在应用 MobileNet SSD 模型进行实时动物分类，以解决农业领域野生动物对作物的威胁，通过智能稻草人与目标检测的无缝集成，为精准农业提供了一种健壮的解决方案。

Jul, 2024

基于学习到的广义测地线距离函数的图节点特征增强方法

利用学习到的广义测地距离函数， LGGD 方法在图像处理、计算机图形学和计算机视觉领域中应用广泛，其在节点分类任务中具有改进的性能，并在真实图数据集上达到与最先进方法相竞争的结果，同时还展示了参数在图中广义测地方程中的可学习性以及新标签的动态包含能力。

Jul, 2024

提高行人安全性的雪天检测图像分类

本研究利用计算机视觉方法，在人行道和路面上检测积雪，以减少冬季相关的跌倒伤害，特别是对于老年人和视障人士。该研究采用经过精细调整的 VGG-19 和 ResNet50 卷积神经网络，重点是在这些图像中识别积雪的存在。研究使用包含 98 个图像的数据集，均匀分为积雪和无积雪条件，采用 F1 得分和准确性度量标准对其进行评估。本研究通过采用经过精细调整的卷积神经网络架构，有效地从智能手机拍摄的图像中检测到路面上的积雪，建立在现有研究的基础上。该方法结合了迁移学习和模型集成技术，综合了 VGG19 和 ResNet50 架构的最佳预测结果。这项研究展示了计算机视觉在应对冬季相关危害中对弱势群体的潜力，并取得了 81.8% 和 81.7% 的准确性和 F1 得分。

Jun, 2024

基于 Transformer 的图像和视频修复：当前挑战与未来方向

本文综述了当前图像或视频修复方法，特别关注基于 Transformer 的技术，旨在突出显著改进的方法，为图像或视频修复领域的新研究者提供指南，并通过其架构配置、损伤类型和性能指标对基于 Transformer 的技术进行分类。另外，我们提出了当前挑战的整理综合，以及对图像或视频修复领域未来研究的建议。

Jun, 2024

具有深度学习和自然语言能力的辅助图像标注系统：一项综述

本研究论文探讨了在计算机视觉任务中，超分辨率学习取得了显著的成功，但获取高质量的标注数据仍然是一个瓶颈。作者调查了 AI 辅助深度学习图像标注系统的学术和非学术作品，这些系统为注释者提供关于输入图像的文本建议、标题或描述，从而提高注释效率和质量。研究涵盖了各种计算机视觉任务的标注，包括图像分类、目标检测、回归、实例、语义分割和姿态估计。作者回顾了各种数据集以及它们对 AI 辅助标注系统的训练和评估的贡献。此外，作者还研究了利用神经符号学习、深度主动学习和自监督学习算法实现语义图像理解和生成自由文本输出的方法，包括图像字幕生成、视觉问答和多模态推理。尽管前景看好，但 AI 辅助图像标注与文本输出能力的公开可用作品有限。文章最后提出了未来研究方向的建议，强调了更多公开可用的数据集和学术界与工业界合作的必要性。

Jun, 2024

基于细粒度梯度保持的脑肿瘤分类的深度融合模型

该研究提出了一种精确的大脑肿瘤分类方法，通过融合预训练的 ResNet152V2 和修改的 VGG16 模型，在深度神经网络中保留细微的梯度以实现有效的肿瘤分类，并结合各种图像处理技术来改善图像质量，准确度分别达到 98.36% 和 98.04%，并且在资源受限的边缘设备上能够平滑部署。

Jun, 2024