WWWFeb, 2022
WebFormer: 网页转换器,用于结构信息提取
WebFormer: The Web-page Transformer for Structure Information Extraction
Qifan Wang, Yi Fang, Anirudh Ravula, Fuli Feng, Xiaojun Quan...
TL;DR本文介绍了 WebFormer,一种从 Web 文档中提取结构化信息的 Web 页面转换模型,借助自然语言模型和图注意力等技术,实现了序列化难以提取出的 Web 页面标记数据的结构化信息提取,通过 SWDE 和 Common Crawl 测试基准得出了比其他先进方法更优越的实验结果。