Mar, 2024

利用弱标注数据在混合代码 Hinglish 中进行仇恨言论检测:基于可行性驱动的迁移学习方法与大型语言模型

TL;DR采用大语言模型(LLMs)进行很少标记的训练,结合零样本学习和少样本学习等方法,成功应用于 Hinglish 中的仇恨言论检测和粗细粒度的厌女症分类,研究表明使用 Bidirectional Auto-Regressive Transformers(BART)大模型的零样本分类和使用 Generative Pre-trained Transformer- 3(ChatGPT-3)的少样本提示获得了最佳结果。