Jan, 2021

网络可转移属性抽取的简化 DOM 树

TL;DR本文介绍了一种新方法 --SimpDOM,可以高效地从 HTML 文档中提取结构化对象的各种属性,为大规模知识库构建、电子商务产品搜索和个性化推荐等下游应用提供帮助,并通过在 SWDE 公共数据集上的广泛实验展示了 SimpDOM 的良好性能。