WWWFeb, 2022

WebFormer: 网页转换器,用于结构信息提取

TL;DR本文介绍了 WebFormer,一种从 Web 文档中提取结构化信息的 Web 页面转换模型,借助自然语言模型和图注意力等技术,实现了序列化难以提取出的 Web 页面标记数据的结构化信息提取,通过 SWDE 和 Common Crawl 测试基准得出了比其他先进方法更优越的实验结果。