Mar, 2023

ICPR MSR 挑战赛 dun_oscar 团队系统描述

TL;DR介绍了 dun_oscar 团队提交的 ICPR MSR Challenge 系统,分别描述了任务 1 - 任务 3 的三个子系统。在任务 1 中,我们开发了一个视觉系统,包括 OCR 模型、文本跟踪器和 NLP 分类器,用于区分字幕和非字幕。任务 2 中,我们采用了一个包括 18 层 AM 和 4-gram LM 的 ASR 系统,并进行了半监督学习。任务 3 中,我们采用 ASR 系统来改进视觉系统,一些错误的字幕可以通过融合模块进行纠正。