Feb, 2022
多语种音频中的滥用检测(ADIMA)
ADIMA: Abuse Detection In Multilingual Audio
Vikram Gupta, Rini Sharon, Ramit Sawhney, Debdoot Mukherjee
TL;DR使用自动语音识别和自然语言处理方法进行指辞文本检测,提出了一种说明性多语种骂人检测音频数据集(ADIMA),该数据集取样 10 个印度语言,包含 11,775 个音频样本,旨在实现 Indic 语言中音频内容审核的民主化。