Apr, 2022

自动化语音工具,帮助社区处理受限语料库以推进语言复兴

TL;DR该研究提出了一种隐私保护的工作流程,通过集成语音活动检测(VAD)、自动语音识别(ASR)等技术,提高对受保护语言音频数据的注释效率。该流程旨在为那些使用英语等共同语言进行元语言评论和提问的语音录音解决元语言转录上的问题。研究结果表明匹配得当的这种方法可以在保持数据私密原则的前提下加速记录的元语言转录,并有效减少了数据浏览和筛选的时间。