Bloomier Filters: 二次审视

Jul, 2008

Bloomier Filters: A second look

Denis Charles, Kumar Chellapilla

TL;DR本文提出了一种线性空间和常数时间可评估的 Bloomier 过滤器，并展示了如何在牺牲时间的代价下提高空间利用率。

Abstract

A bloom filter is a space efficient structure for storing static sets, where the space efficiency is gained at the expense of a small probability of →

bloom filter bloomier filter space efficiency false-positives function support

发现论文，激发创造

布隆地图

研究如何用 Bloom map 数据结构提供静态地图的近似查询，并在误差率和 value 分布的熵的基础上推导出其上下界，该下界由信息论论证得到。

Oct, 2007

对抗环境下的布隆过滤器

本研究通过引入敌对模型，研究了布隆过滤器在不同 adversary 情况下的表现，并证明了它与密码学的紧密联系。

Dec, 2014

学习型布隆过滤器中分类器选择的关键分析

提出一种用于设计、分析和实现 “Learned Bloom Filters” 的新方法，并结合分类器和数据集进行了性能评估，我们的实验表明，这种方法和软件可以有效地帮助确定最佳的分类器和最适合不同数据复杂度问题的 “Learned Bloom Filters” 的类型。

Nov, 2022

Bloom Filters，自适应性和字典问题

本文介绍了一种高效的数据结构 -- 布隆过滤器，它可以在 remote storage 等场景中高效的进行 approximate membership query, 并通过 adaptive AMQs 保证了 false-positive probability 的可控性。

Nov, 2017

学习式布隆过滤器模型及夹心优化

本文研究了基于机器学习的预处理器对 Bloom 过滤器的增强，并提出了一种优化学习到的布隆过滤器性能的方法，最终提出了一种设计和分析方法来定义 learned Bloomier filter。

Jan, 2019

元学习神经布隆过滤器

本文探讨通过元学习一次性实现近似集合成员关系的学习，提出了一种新的记忆体架构，神经布隆过滤器（Neural Bloom Filter）可以在经典布隆过滤器和现有的内存增强神经网络上实现显著的压缩增益。

Jun, 2019

通过夹层法优化学习布隆过滤器

本文提出一种简单方法用于提高学习型 Bloom 过滤器的性能，即将学习功能夹在两个 Bloom 过滤器之间以实现更好的性能。

Mar, 2018

深度推荐系统的优化：基于布隆嵌入的稀疏二元输入 / 输出网络

提出了一种能够在使用深度学习从推荐领域提取数据时对输入和输出进行压缩的方法 Bloom embeddings，并在对七个数据集的测试表明此方法能够提供计算效率和比原始方法更高的准确性。

Jun, 2017

自适应杜鹃过滤器

介绍了自适应布谷鸟过滤器（ACF）, 这是一种数据结构，扩展了布谷鸟过滤器，通过对错误正例进行反应，并为将来的查询将其删除，用于近似集成员的，在数据包处理中，通过搜索特定流的标识符来查询元素，ACF 能够通过使用布谷鸟哈希表存储指纹并能够使指纹条目针对错误的正例进行反应，并在最小化对滤波器性能的影响方面设计指纹条目更改，通过理论模型和模拟数据，可大幅度降低误报率。

Apr, 2017

b-Bit 最小哈希

本文建立了 b 位最小哈希的理论框架，通过仅存储每个（最小化）哈希值的最低 b 位，可以在计算效率和存储空间方面获得相当大的优势，提供了任何 b 的相似度的无偏估计，即使在最不利的情况下，使用 b = 1 也可以将存储空间至少减少 21.3（或 10.7）倍，如果对相似度 > 0.5 感兴趣。

Oct, 2009