Sep, 2018

謹言慎語:用於混合語言的濫用與冒犯檢測

TL;DR本研究中,我们使用迁移学习和基于 LSTM 的模型对印地语和英语 (hinglish) 混合使用的口语文本中的攻击和滥用语言进行检测和分类,该模型比现有最佳模型表现更好,在 Hinglish 攻击文本分类领域成为最先进技术。我们还为研究目的发布了我们的模型和训练嵌入。