ICME 2022 少样本 LOGO 检测前九解决方案

Jun, 2022

ICME 2022 少样本 LOGO 检测前九解决方案

ICME 2022 Few-shot LOGO detection top 9 solution

Ka Ho Tong, Ka Wai Cheung, Xiaochuan Yu

TL;DR技术报告总结了我们在 ICME-2022 少样本学习 logo 检测比赛中使用的技术和潜在改进，要求参与者使用单个模型处理小型 Logo 实例、相似品牌和对抗性图像，限定少量注释。我们的团队在比赛的第一轮和第二轮中分别排名第 16 和第 11，最终排名第 9。

Abstract

icme-2022 few-shot logo detection competition is held in May, 2022. Participants are required to develop a single model to detect logos by handling tiny logo instances, similar brands, and →

icme-2022 few-shot learning logo detection adversarial images model optimization

发现论文，激发创造

开放式标志检测挑战

介绍了一种更加现实和具有挑战性的 Logo 检测模式 Open Logo Detection，并提出了一种 Context Adversarial Learning 方法以解决在训练数据较少的情况下，对于新 Logo 种类的更好检测问题。实验证明，该方法在 OpenLogo 检测基准测试中表现优异。

Jul, 2018

MIPI 2024 挑战赛：少样本 RAW 图像降噪的方法和结果

在 MIPI 2024 中，本文总结和回顾了少样本 RAW 图像去噪音的挑战，共有 165 名参与者成功注册，并有 7 支团队在最终测试阶段提交了成果，这次挑战的解决方案在少样本 RAW 图像去噪音上取得了最新的成果。

Jun, 2024

使用代理进行可扩展的 Logo 识别

本文研究了 logo 识别问题，提出了一种 few-shot 目标检测的解决方案，其中主要包括通用的 logo 检测器和 few-shot logo 识别器，通过最近邻搜索和训练三元损失函数使用代理进行分类，提出了一个新的 2000 个 logo 的产品数据集 PL2K，并在 PL2K 测试数据集上实现了 97％的召回率和 0.6 mAP，并在公开可用的 FlickrLogos-32 测试集上实现了 0.565 mAP 的最优结果。

Nov, 2018

2023 年 ICDAR 分层文本检测与识别竞赛

我们组织了一个层级文本检测和识别的比赛，以促进对深度学习模型和系统的研究，这些模型和系统可以共同执行文本检测、识别和几何布局分析。比赛期间至少有 20 个团队提交了 50 份申请，本报告中还将介绍比赛结果和洞见。

May, 2023

IMC 2024 方法与解决方案综述

该研究介绍了一种先进的集成技术，用于解决 3D 图像重建问题，并综合审查了参与竞赛的顶级团队采用的现有方法和技术，为未来的参与者和研究人员在类似的图像匹配和重建挑战中取得优异成绩提供了宝贵的知识。

Jul, 2024

深度学习用于标志识别

本研究提出一种采用深度学习进行标志识别的方法，通过 logo 区域建议和卷积神经网络进行分类，实验证实了通过人工合成数据来增加识别准确性的可行性。

Jan, 2017

DeepLogo: 使用深度神经网络擊敗商標识别

本文提出基于深度卷积神经网络的标志识别方法，并在一项流行的标志识别数据集上的准确性方面超过已发表的最新技术水平。

Oct, 2015

对比多视角文本视觉编码：实现十万级一次性标志识别

本文研究了在开放式单次设置下识别自然场景中商业品牌标识的问题，提出了一种新的多视图文本视觉编码框架来学习鲁棒的对比表示，并引入了一个包含来自 Wikidata 的 10 万个商业品牌标识的参考标识数据集 WiRLD。该方法表现出更好的稳定性，并且在多项任务上的表现优于现有技术。

Nov, 2022

Google 通用图像嵌入竞赛第二名解决方案

本文介绍了第二名在 Google 通用图像嵌入竞赛中的解决方案，主要探讨了数据建立，模型结构和训练策略对细粒度图像分类的影响，并在公共排行榜得分为 0.713，在私人排行榜得分为 0.709。

Oct, 2022

通过合成背景扩充数据，进行深度学习实现品牌标识检测

本文介绍了一种图像合成方法，能够在非受控环境中识别标志的有效性，从而避免昂贵的手动标注成本。该方法为生成合成上下文标志的训练图像设计了一种算法，提高了模型对未知背景干扰的鲁棒性，从而提高了标志识别的性能。我们还引入了一个新的标志检测数据集 TopLogo-10 进行模型性能基准测试，该数据集包含了在丰富的视觉语境中捕捉的十个最受欢迎的服装 / 可穿戴品牌名称标志。广泛的比较显示了我们提出的 SCL 模型在使用两个真实世界标志基准数据集 FlickrLogo-32 和我们的新 TopLogo-10 的标志检测方面优于现有的最新技术。

Dec, 2016