Apr, 2024

HateTinyLLM:使用微型大型语言模型进行仇恨言论检测

TL;DR本研究介绍了一种名为 HateTinyLLM 的基于精调的解码器型微型大型语言模型(tinyLLM)的新框架,用于高效检测仇恨言论。实验证明,精调的 HateTinyLLM 在检测效果上明显优于预训练的 mixtral-7b 模型。我们尝试了多个微型 LLM,包括 PY007/TinyLlama-1.1B-step-50K-105b、Microsoft/phi-2 和 facebook/opt-1.3b,并通过 LoRA 和适配器方法进行了精调。观察结果表明,所有基于 LoRA 的精调模型的准确率都超过 80%。