Apr, 2025

网络爬虫的文档质量评分

TL;DR本研究解决了网络内容低质量对搜索引擎绩效的影响,提出了一种新的基于神经网络的页面语义质量评分方法。实验表明,通过优先处理高质量页面,能够显著提升搜索的有效性。此外,研究还提供了一个可在其他搜索系统组件中方便集成和使用的质量评分Docker容器。