Bloomier Filters: 二次审视
提出一种用于设计、分析和实现 “Learned Bloom Filters” 的新方法,并结合分类器和数据集进行了性能评估,我们的实验表明,这种方法和软件可以有效地帮助确定最佳的分类器和最适合不同数据复杂度问题的 “Learned Bloom Filters” 的类型。
Nov, 2022
本文介绍了一种高效的数据结构 -- 布隆过滤器,它可以在 remote storage 等场景中高效的进行 approximate membership query, 并通过 adaptive AMQs 保证了 false-positive probability 的可控性。
Nov, 2017
本文研究了基于机器学习的预处理器对 Bloom 过滤器的增强,并提出了一种优化学习到的布隆过滤器性能的方法,最终提出了一种设计和分析方法来定义 learned Bloomier filter。
Jan, 2019
本文探讨通过元学习一次性实现近似集合成员关系的学习,提出了一种新的记忆体架构,神经布隆过滤器(Neural Bloom Filter)可以在经典布隆过滤器和现有的内存增强神经网络上实现显著的压缩增益。
Jun, 2019
提出了一种能够在使用深度学习从推荐领域提取数据时对输入和输出进行压缩的方法 Bloom embeddings,并在对七个数据集的测试表明此方法能够提供计算效率和比原始方法更高的准确性。
Jun, 2017
介绍了自适应布谷鸟过滤器(ACF), 这是一种数据结构,扩展了布谷鸟过滤器,通过对错误正例进行反应,并为将来的查询将其删除,用于近似集成员的,在数据包处理中,通过搜索特定流的标识符来查询元素,ACF 能够通过使用布谷鸟哈希表存储指纹并能够使指纹条目针对错误的正例进行反应,并在最小化对滤波器性能的影响方面设计指纹条目更改,通过理论模型和模拟数据,可大幅度降低误报率。
Apr, 2017
本文建立了 b 位最小哈希的理论框架,通过仅存储每个(最小化)哈希值的最低 b 位,可以在计算效率和存储空间方面获得相当大的优势,提供了任何 b 的相似度的无偏估计,即使在最不利的情况下,使用 b = 1 也可以将存储空间至少减少 21.3(或 10.7)倍,如果对相似度 > 0.5 感兴趣。
Oct, 2009