Jun, 2023

揭示印度选举活动期间的政治仇恨言论:一个新的低资源数据集和基线

TL;DR本文介绍了一个新数据集 IEHate,该数据集包含 11,457 个手动注释的印地语推文,主要研究议会选举中的仇恨言论检测问题,并使用多种机器学习、深度学习和变形器算法来检测和分析数据集,结果表明在低资源语言中进行恶意言论检测任重道远,需要更先进的技术,并强调了在恶意言论检测中同时应该使用人工和自动化方法。