Nov, 2022
CoLI-Machine Learning 在卡纳达语 - 英语文本的词级别混合语言识别中的应用
CoLI-Machine Learning Approaches for Code-mixed Language Identification at the Word Level in Kannada-English Texts
H.L. Shashirekha, F. Balouchzahi, M.D. Anusha, G. Sidorov
TL;DR该研究针对代码混合文本的词级别语言识别问题,构建了 CoLI-Kenglish 数据集,利用机器学习、深度学习和迁移学习方法建立和评估了 CoLI-vectors、CoLI-BiLSTM 和 CoLI-ULMFiT 学习模型,研究结果表明 CoLI-ngrams 模型在所有模型中取得了最好的效果。