May, 2024

智能双语并行文档聚焦抓取

TL;DR通过智能爬虫方法,从互联网上下载的大量文档中更快地发现平行内容,减少无用文档的下载量,并与传统爬虫方法相比,获得更多的平行文档。