May, 2024

可解释检测器:探索基于 Transformer 的语言建模方法用于具有可解释性分析的短信垃圾检测

TL;DR使用优化和微调的基于 Transformer 的大型语言模型解决短信垃圾信息检测问题,通过预处理技术、文本扩增技术解决数据噪声和类别不平衡问题,实验结果显示我们的优化微调 BERT 模型 RoBERTa 在短信垃圾信息检测任务中获得 99.84% 的高准确率,并采用可解释人工智能(XAI)技术探索和解释模型的透明性,对比了传统机器学习模型和基于 Transformer 的模型性能,描述了大型语言模型在信息安全领域中对复杂文本垃圾数据的积极影响。