密集文本与小文本视频文本阅读比赛 (ICDAR 2023)

Apr, 2023

密集文本与小文本视频文本阅读比赛 (ICDAR 2023)

ICDAR 2023 Video Text Reading Competition for Dense and Small Text

Weijia Wu, Yuzhong Zhao, Zhuang Li, Jiahong Li, Mike Zheng Shou...

TL;DR本文描述了一项视频文本阅读基准（DSText），该基准专注于视频中具有挑战性的密集和小文本的阅读挑战，包括文本检测、跟踪和识别。

Abstract

Recently, video text detection, tracking, and recognition in natural scenes are becoming very popular in the computer vision community. Ho

video text challenges benchmark tracking recognition

发现论文，激发创造

DSText V2：针对密集细小文字的综合视频文字识别数据集

该研究提出了一个名为 DSText V2 的视频文本阅读基准，着重解决了视频中密集、小字体的阅读难题，并且包含了新的场景和任务，如视频文本检测、跟踪以及端到端视频文本定位。该文章还对数据集进行了详细的统计分析，并提供了洞察和分析针对该数据集中的三个独特挑战，旨在为研究人员带来新的见解。

Nov, 2023

ICDAR 2023 结构化文本提取竞赛之视觉丰富文档图像

ICDAR 2023 competition on Structured text extraction from Visually-Rich Document images (SVRD) organized with two tracks for evaluating end-to-end Complex Entity Linking and Labeling and Zero-shot / Few-shot Structured Text extraction respectively, with more than 50 types of visually-rich document images from enterprise applications, attracting 35 and 15 participants respectively and revealing a large gap in expected information extraction performance for complex and zero-shot scenarios.

Jun, 2023

2023 年 ICDAR 分层文本检测与识别竞赛

我们组织了一个层级文本检测和识别的比赛，以促进对深度学习模型和系统的研究，这些模型和系统可以共同执行文本检测、识别和几何布局分析。比赛期间至少有 20 个团队提交了 50 份申请，本报告中还将介绍比赛结果和洞见。

May, 2023

ICDAR 2015 野外文本阅读竞赛

该技术报告介绍了 ICDAR 2015 年 TRW2015 竞赛的最终结果，该竞赛旨在为设计用于中英文脚本的检测和识别算法提供基准，并为社区的研究人员提供一个游戏场。本文详细描述了数据集，任务，评估协议和参与者，报告了参与方法的性能，并讨论了未来研究的有前途的方向。

Jun, 2015

ICDAR 2019 大规模街景文本部分标注竞赛 --RRC-LSVT

ICDAR 2019-LSVT competition aims to improve the performance of text reading from street view images through exploring state-of-the-art methods on a Large-scale Street View Text with Partial Labeling (LSVT) challenge, which provides 50,000 and 400,000 fully and weakly annotated images, respectively, leading to 41 teams participating in the two proposed tasks of text detection and end-to-end text spotting.

Sep, 2019

ICDAR 2019 场景文本视觉问答竞赛

本文介绍了 ICDAR 2019 场景文本视觉问答比赛 (ST-VQA) 的最终结果和新数据集，包括 23038 张图像和 31791 个文本实例答案，涵盖广泛的情景。该竞赛共有 3 个递增的任务，需要理解场景中的文本并回答问题。提出了一种新的评估度量标准，旨在评估文本识别和图像理解两种关键能力。结果分析提供了 VQA 系统当前的能力洞见。此数据集标志着使用场景文本实现全面图像理解的更强大、更通用的模型的重要里程碑。

Jun, 2019

ICDAR 2023 读取印章比赛

本文介绍了 ICDAR 2023 印章标题文本识别（ReST）比赛，并概述了比赛的组织、挑战和结果，报道了来自学术界和工业界的 53 位参与者，包括 28 个 Task 1 的提交和 25 个 Task 2 的提交，结果表明印章标题文本识别领域已取得了重要进展，激励了进一步的研究和发展。

Apr, 2023

ICDAR 2015 鲁棒阅读竞赛挑战 4 中的非正式场景文本理解最近的进展

本研究报告介绍了我们针对 ICDAR 2015 Robust Reading Competition Challenge 4 中的场景文本探测和识别问题的策略，以及与该领域之前的研究成果进行比较的方法。

Nov, 2015

ICDAR2019 关于任意形状文本的鲁棒性阅读挑战（RRC-ArT）

本文报道了 ICDAR2019 关于任意形状文本 (RRC-ArT) 的鲁棒性阅读挑战，重点包括场景文本检测、场景文本识别、场景文本识别，并介绍了该挑战的数据集、任务描述、评估指标和参与者方法。

Sep, 2019

ICDAR2019 多语言场景文本检测和识别鲁棒性挑战 —RRC-MLT-2019

本文介绍了基于 RRC-MLT-2017 的文本检测和识别竞赛，该竞赛包含一个新的端到端任务、一个现实图像数据集中的额外语言，一个大规模的多语言合成数据集以辅助训练，并提出了一个基线端到端识别方法。该竞赛总共收到了来自研究和工业界的 60 份提交，本文展示了该竞赛的数据集、任务和发现结果。

Jul, 2019