Mar, 2012

BlinkDB: 在大数据上具有有界误差和有界响应时间的查询

TL;DR本文介绍了 BlinkDB,一种基于采样的大规模并行近似查询引擎,用于在大量数据上运行临时交互式 SQL 查询。BlinkDB 允许用户在查询精度和响应时间之间权衡,通过在数据样本上运行查询并呈现带有有意义误差条的结果,从而实现对海量数据的交互式查询。