Apr, 2025

PixelWeb:首个具有像素级标签的网页GUI数据集

TL;DR本文解决了现有GUI数据集中自动标注造成的不准确元素边界框(BBox)标注问题,包括缺失、重复或无意义的区域。研究提出的PixelWeb数据集采用新颖的自动注释方法,结合视觉特征提取和文档对象模型(DOM)结构分析,提供了超过100,000个注释网页的高质量像素级标注。实验结果表明,PixelWeb在GUI元素检测任务中的表现显著优于现有数据集,展示了其在后续任务中的潜力。