Nov, 2023

DSText V2:针对密集细小文字的综合视频文字识别数据集

TL;DR该研究提出了一个名为 DSText V2 的视频文本阅读基准,着重解决了视频中密集、小字体的阅读难题,并且包含了新的场景和任务,如视频文本检测、跟踪以及端到端视频文本定位。该文章还对数据集进行了详细的统计分析,并提供了洞察和分析针对该数据集中的三个独特挑战,旨在为研究人员带来新的见解。