密集文本与小文本视频文本阅读比赛 (ICDAR 2023)
该研究提出了一个名为 DSText V2 的视频文本阅读基准,着重解决了视频中密集、小字体的阅读难题,并且包含了新的场景和任务,如视频文本检测、跟踪以及端到端视频文本定位。该文章还对数据集进行了详细的统计分析,并提供了洞察和分析针对该数据集中的三个独特挑战,旨在为研究人员带来新的见解。
Nov, 2023
ICDAR 2023 competition on Structured text extraction from Visually-Rich Document images (SVRD) organized with two tracks for evaluating end-to-end Complex Entity Linking and Labeling and Zero-shot / Few-shot Structured Text extraction respectively, with more than 50 types of visually-rich document images from enterprise applications, attracting 35 and 15 participants respectively and revealing a large gap in expected information extraction performance for complex and zero-shot scenarios.
Jun, 2023
我们组织了一个层级文本检测和识别的比赛,以促进对深度学习模型和系统的研究,这些模型和系统可以共同执行文本检测、识别和几何布局分析。比赛期间至少有 20 个团队提交了 50 份申请,本报告中还将介绍比赛结果和洞见。
May, 2023
该技术报告介绍了 ICDAR 2015 年 TRW2015 竞赛的最终结果,该竞赛旨在为设计用于中英文脚本的检测和识别算法提供基准,并为社区的研究人员提供一个游戏场。本文详细描述了数据集,任务,评估协议和参与者,报告了参与方法的性能,并讨论了未来研究的有前途的方向。
Jun, 2015
ICDAR 2019-LSVT competition aims to improve the performance of text reading from street view images through exploring state-of-the-art methods on a Large-scale Street View Text with Partial Labeling (LSVT) challenge, which provides 50,000 and 400,000 fully and weakly annotated images, respectively, leading to 41 teams participating in the two proposed tasks of text detection and end-to-end text spotting.
Sep, 2019
本文介绍了 ICDAR 2019 场景文本视觉问答比赛 (ST-VQA) 的最终结果和新数据集,包括 23038 张图像和 31791 个文本实例答案,涵盖广泛的情景。该竞赛共有 3 个递增的任务,需要理解场景中的文本并回答问题。提出了一种新的评估度量标准,旨在评估文本识别和图像理解两种关键能力。结果分析提供了 VQA 系统当前的能力洞见。此数据集标志着使用场景文本实现全面图像理解的更强大、更通用的模型的重要里程碑。
Jun, 2019
本文介绍了 ICDAR 2023 印章标题文本识别(ReST)比赛,并概述了比赛的组织、挑战和结果,报道了来自学术界和工业界的 53 位参与者,包括 28 个 Task 1 的提交和 25 个 Task 2 的提交,结果表明印章标题文本识别领域已取得了重要进展,激励了进一步的研究和发展。
Apr, 2023
本研究报告介绍了我们针对 ICDAR 2015 Robust Reading Competition Challenge 4 中的场景文本探测和识别问题的策略,以及与该领域之前的研究成果进行比较的方法。
Nov, 2015
本文报道了 ICDAR2019 关于任意形状文本 (RRC-ArT) 的鲁棒性阅读挑战,重点包括场景文本检测、场景文本识别、场景文本识别,并介绍了该挑战的数据集、任务描述、评估指标和参与者方法。
Sep, 2019
本文介绍了基于 RRC-MLT-2017 的文本检测和识别竞赛,该竞赛包含一个新的端到端任务、一个现实图像数据集中的额外语言,一个大规模的多语言合成数据集以辅助训练,并提出了一个基线端到端识别方法。该竞赛总共收到了来自研究和工业界的 60 份提交,本文展示了该竞赛的数据集、任务和发现结果。
Jul, 2019