Feb, 2025

实时设备覆盖预测利用HLL和MinHash数据草图

TL;DR本研究解决了基于用户指定目标属性进行实时设备覆盖预测的慢速传统SQL查询带来的问题,导致客户入驻时间长达24小时,对业务造成潜在损失。通过使用MinHash和HyperLogLog(HLL)数据草图构建的新实时预测系统,不仅提高了预测速度,且保证了准确性,使结果与传统离线预测系统相当,误差率可接受为5%。