LDRNet: 移动设备上实时文档定位技术

KDDJun, 2022

LDRNet: 移动设备上实时文档定位技术

LDRNet: Enabling Real-time Document Localization on Mobile Devices

Han Wu, Holland Qian, Huaming Wu, Aad van Moorsel

TL;DR本文提出了基于边缘智能辅助的方法，设计了一个实时身份证验证（IDV）系统，LDRNet，用于在移动设备上本地化身份文件，增强 IDV 过程的响应性和准确率。

Abstract

While identity document verification (IDV) technology on mobile devices becomes ubiquitous in modern business operations, the risk of identity theft and fraud is increasing. The identity document holder is normally required to participate in an online video interview to circumvent impo

identity document verification edge intelligence-assisted approach ldrnet document localization real-time

发现论文，激发创造

MIDV-2019：现代基于手机的文档 OCR 的挑战

本文介绍了一个包含在不同条件下使用现代高分辨率移动相机拍摄的影片的 MIDV-2019 数据集，其中包含解决诸如识别身份证件、文本字段识别等问题的方法和算法的方法组合。

Oct, 2019

MIDV-500: 移动设备上身份证件分析和识别的视频流数据集

本文介绍了一个 Mobile Identity Document Video 数据集 (MIDV-500)，其中包含来自 50 个不同身份证件类型的 500 个视频剪辑，提供了地面真实性，方便进行广泛的文档分析问题的研究，同时给出了人脸检测、文字行识别和文档域数据抽取的评估结果。

Jul, 2018

InstantID: 秒级零样本保身份生成

我们介绍了基于 InstantID 的个性化图像合成方法，通过应用 IdentityNet 模型，使用单张面部图像实现各种风格的图像个性化，同时确保高保真度，并与 SD1.5 和 SDXL 等常用预训练文本到图像扩散模型无缝集成，具有卓越的性能和高效性，在重视身份保护的实际应用中极具益处。

Jan, 2024

IDTrust：深度身份证件服务质量检测与带通滤波

IDTrust 是一个基于深度学习的系统，通过使用深度学习方法来改善身份证明文件的质量，从而提供了数据集适用性的重大改进。通过利用基于带通滤波的方法，该系统旨在有效检测和区分身份证明文件的质量，并通过在 MIDV-2020 和 L3i-ID 数据集上进行广泛实验，识别出最佳参数，显著改善了区分性能，有效区分原始和扫描身份证明文件。

Mar, 2024

文本语言识别

利用微博和深度学习技术，研发了一种可靠的语言识别引擎，在 Discriminating between Similar Languages (DSL) Shared Task 2015 数据集上达到了 95.12% 的准确率。

Jan, 2017

IDNet：基于卷积神经网络的智能手机步态识别

使用智能手机的加速度计和陀螺仪信号识别用户的步态，实现基于步态的用户身份认证，最小化认证错误率，并且技术与现有方法相比显著优越。

Jun, 2016

身份证件全息图验证的弱监督训练

提出一种方法，通过在普通光照条件下处理智能手机捕捉的视频片段，远程验证身份文件中的光变设备（常称为 “全息图”），并在两个公共数据集上进行评估。该方法采用弱监督训练，优化特征提取和决策流程，实现了对 MIDV-HOLO 的新领先性能，并在作为攻击样本使用的 MIDV-2020 文档上保持了高召回率。这也是首个有效解决照片替换攻击任务的方法，可以根据需要训练真实样本、攻击样本或二者兼而有之，以提高性能。通过能够在很少的监督下验证 OVD 的形状和动态，这项工作为在普通智能手机上构建具有鲁棒性的远程身份文件验证系统提供了新途径。

Apr, 2024

实时、轻量级的线段检测

本文提出了一种用于资源受限环境下的轻量级、实时的线段检测器 Mobile LSD (简称 M-LSD)，通过设计高效的 LSD 模型结构和新颖的训练策略，使得该模型在手机设备上可以实现有竞争力的性能，其模型大小为现有方法的 2.5％，推理速度提高了 130.5％。此外，该模型可以在最新的 Android 和 iPhone 手机设备上以超过 48fps 的速度运行。

Jun, 2021

车辆再识别的强基线

本文提出了一种针对第五届 AI 城市挑战赛数据集 Track 2 的车辆识别方法，包括缩小真实与合成数据之间的域间差距、通过堆叠多个具有注意力机制的网络头进行网络修改、自适应损失权重调整等。该方法在不使用外部数据集或伪标签的情况下，在私人 CityFlow 测试集上实现 61.34％的 mAP，并在 Veri 基准测试中以 87.1％的 mAP 超越了所有先前的工作。

Apr, 2021

移动边缘云中基于实时分布式推理的身份感知属性识别

本文提出了一种基于移动边缘云的行人属性识别和人员重识别模型，并研究了 MEC 网络中的分布式推断问题，评估结果表明，所提出的算法在准确性和延迟方面都有很大提高。

Aug, 2020