COLINGFeb, 2024
AnnoTheia:音像语音技术半自动标注工具包
AnnoTheia: A Semi-Automatic Annotation Toolkit for Audio-Visual Speech Technologies
José-M. Acosta-Triana, David Gimeno-Gómez, Carlos-D. Martínez-Hinarejos
TL;DR为了推动低资源语言的视听说技术的研究,我们提出了 AnnoTheia,这是一个半自动注释工具包,可以检测场景中人们的说话以及相应的转录。此外,我们还介绍了将一个预训练模型用于西班牙语的活动说话者检测的适应过程,使用了最初并非为此类任务而设计的数据库。AnnoTheia 工具包、教程和预训练模型已经在 GitHub 上提供。