LDRNet: 移动设备上实时文档定位技术
本文介绍了一个包含在不同条件下使用现代高分辨率移动相机拍摄的影片的 MIDV-2019 数据集,其中包含解决诸如识别身份证件、文本字段识别等问题的方法和算法的方法组合。
Oct, 2019
本文介绍了一个 Mobile Identity Document Video 数据集 (MIDV-500),其中包含来自 50 个不同身份证件类型的 500 个视频剪辑,提供了地面真实性,方便进行广泛的文档分析问题的研究,同时给出了人脸检测、文字行识别和文档域数据抽取的评估结果。
Jul, 2018
我们介绍了基于 InstantID 的个性化图像合成方法,通过应用 IdentityNet 模型,使用单张面部图像实现各种风格的图像个性化,同时确保高保真度,并与 SD1.5 和 SDXL 等常用预训练文本到图像扩散模型无缝集成,具有卓越的性能和高效性,在重视身份保护的实际应用中极具益处。
Jan, 2024
IDTrust 是一个基于深度学习的系统,通过使用深度学习方法来改善身份证明文件的质量,从而提供了数据集适用性的重大改进。通过利用基于带通滤波的方法,该系统旨在有效检测和区分身份证明文件的质量,并通过在 MIDV-2020 和 L3i-ID 数据集上进行广泛实验,识别出最佳参数,显著改善了区分性能,有效区分原始和扫描身份证明文件。
Mar, 2024
利用微博和深度学习技术,研发了一种可靠的语言识别引擎,在 Discriminating between Similar Languages (DSL) Shared Task 2015 数据集上达到了 95.12% 的准确率。
Jan, 2017
提出一种方法,通过在普通光照条件下处理智能手机捕捉的视频片段,远程验证身份文件中的光变设备(常称为 “全息图”),并在两个公共数据集上进行评估。该方法采用弱监督训练,优化特征提取和决策流程,实现了对 MIDV-HOLO 的新领先性能,并在作为攻击样本使用的 MIDV-2020 文档上保持了高召回率。这也是首个有效解决照片替换攻击任务的方法,可以根据需要训练真实样本、攻击样本或二者兼而有之,以提高性能。通过能够在很少的监督下验证 OVD 的形状和动态,这项工作为在普通智能手机上构建具有鲁棒性的远程身份文件验证系统提供了新途径。
Apr, 2024
本文提出了一种用于资源受限环境下的轻量级、实时的线段检测器 Mobile LSD (简称 M-LSD),通过设计高效的 LSD 模型结构和新颖的训练策略,使得该模型在手机设备上可以实现有竞争力的性能,其模型大小为现有方法的 2.5%,推理速度提高了 130.5%。此外,该模型可以在最新的 Android 和 iPhone 手机设备上以超过 48fps 的速度运行。
Jun, 2021
本文提出了一种针对第五届 AI 城市挑战赛数据集 Track 2 的车辆识别方法,包括缩小真实与合成数据之间的域间差距、通过堆叠多个具有注意力机制的网络头进行网络修改、自适应损失权重调整等。该方法在不使用外部数据集或伪标签的情况下,在私人 CityFlow 测试集上实现 61.34%的 mAP,并在 Veri 基准测试中以 87.1%的 mAP 超越了所有先前的工作。
Apr, 2021
本文提出了一种基于移动边缘云的行人属性识别和人员重识别模型,并研究了 MEC 网络中的分布式推断问题,评估结果表明,所提出的算法在准确性和延迟方面都有很大提高。
Aug, 2020