May, 2023

基于联合预训练语言模型和图神经网络的Web页面分类方法

TL;DR本研究提出了一种基于 PLM-GNN 的表示和分类方法,利用预训练语言模型和图神经网络对文本和 HTML DOM 树进行联合编码,有效应对网页数据增长的问题,具有较好的分类性能。