Jun, 2018
英印混合码交际媒体内容中的性别预测:语料库和基准系统
Gender Prediction in English-Hindi Code-Mixed Social Media Content : Corpus and Baseline System
Ankush Khandelwal, Sahil Swami, Syed Sarfaraz Akhtar, Manish Shrivastava
TL;DR本研究提出了一种基于多种机器学习算法的基线系统,用于在社交媒体上的英汉混合语言文本中预测作者的性别,该研究使用了一个英汉混合语料库并探索了语言识别的方法。