KDDJan, 2022

从网络中提取产品规格 —— 超越表格和列表

TL;DR利用深度学习和包裹感知算法结合手工设计的特征,我们提出了一个可一般化解析多种 HTML 元素的产品规格表述提取方法,并利用此方法从不同网站的 14,111 个规格表述块中创建了标注数据集,与目前的规格表述提取模型相比,我们的方法具有更高的准确性,且适用于大规模的产品规格提取任务。