ICME 2022 少样本 LOGO 检测前九解决方案
介绍了一种更加现实和具有挑战性的 Logo 检测模式 Open Logo Detection,并提出了一种 Context Adversarial Learning 方法以解决在训练数据较少的情况下,对于新 Logo 种类的更好检测问题。实验证明,该方法在 OpenLogo 检测基准测试中表现优异。
Jul, 2018
在 MIPI 2024 中,本文总结和回顾了少样本 RAW 图像去噪音的挑战,共有 165 名参与者成功注册,并有 7 支团队在最终测试阶段提交了成果,这次挑战的解决方案在少样本 RAW 图像去噪音上取得了最新的成果。
Jun, 2024
本文研究了 logo 识别问题,提出了一种 few-shot 目标检测的解决方案,其中主要包括通用的 logo 检测器和 few-shot logo 识别器,通过最近邻搜索和训练三元损失函数使用代理进行分类,提出了一个新的 2000 个 logo 的产品数据集 PL2K,并在 PL2K 测试数据集上实现了 97%的召回率和 0.6 mAP,并在公开可用的 FlickrLogos-32 测试集上实现了 0.565 mAP 的最优结果。
Nov, 2018
我们组织了一个层级文本检测和识别的比赛,以促进对深度学习模型和系统的研究,这些模型和系统可以共同执行文本检测、识别和几何布局分析。比赛期间至少有 20 个团队提交了 50 份申请,本报告中还将介绍比赛结果和洞见。
May, 2023
该研究介绍了一种先进的集成技术,用于解决 3D 图像重建问题,并综合审查了参与竞赛的顶级团队采用的现有方法和技术,为未来的参与者和研究人员在类似的图像匹配和重建挑战中取得优异成绩提供了宝贵的知识。
Jul, 2024
本文研究了在开放式单次设置下识别自然场景中商业品牌标识的问题,提出了一种新的多视图文本视觉编码框架来学习鲁棒的对比表示,并引入了一个包含来自 Wikidata 的 10 万个商业品牌标识的参考标识数据集 WiRLD。该方法表现出更好的稳定性,并且在多项任务上的表现优于现有技术。
Nov, 2022
本文介绍了第二名在 Google 通用图像嵌入竞赛中的解决方案,主要探讨了数据建立,模型结构和训练策略对细粒度图像分类的影响,并在公共排行榜得分为 0.713,在私人排行榜得分为 0.709。
Oct, 2022
本文介绍了一种图像合成方法,能够在非受控环境中识别标志的有效性,从而避免昂贵的手动标注成本。该方法为生成合成上下文标志的训练图像设计了一种算法,提高了模型对未知背景干扰的鲁棒性,从而提高了标志识别的性能。我们还引入了一个新的标志检测数据集 TopLogo-10 进行模型性能基准测试,该数据集包含了在丰富的视觉语境中捕捉的十个最受欢迎的服装 / 可穿戴品牌名称标志。广泛的比较显示了我们提出的 SCL 模型在使用两个真实世界标志基准数据集 FlickrLogo-32 和我们的新 TopLogo-10 的标志检测方面优于现有的最新技术。
Dec, 2016