May, 2023

利用大型语言模型的知识蒸馏进行网络内容过滤

TL;DR本研究利用大型语言模型进行 URL 分类,并通过知识蒸馏技术生成了精简版学生模型,使得模型在以 URL 为基础的网页分类任务中准确度提高了 9%,比此前状态 - of-the-art 的方法表现更佳,精简版学生模型使得模型可用于大规模 URL 的内联扫描,并且所需的手工标记训练数据量较之前的方法减少了 3 个数量级。