Feb, 2022

多语种音频中的滥用检测(ADIMA)

TL;DR使用自动语音识别和自然语言处理方法进行指辞文本检测,提出了一种说明性多语种骂人检测音频数据集(ADIMA),该数据集取样 10 个印度语言,包含 11,775 个音频样本,旨在实现 Indic 语言中音频内容审核的民主化。