云上关键事件预测的分布式分层局部敏感哈希

NIPSDec, 2017

云上关键事件预测的分布式分层局部敏感哈希

Distributed Stratified Locality Sensitive Hashing for Critical Event Prediction in the Cloud

Alessandro De Palma, Erik Hemberg, Una-May O'Reilly

TL;DR本文介绍了一个用于医疗波形数据的快速相似性预测的分布式系统，它基于层次敏感哈希技术，针对云环境进行了优化，在保证延迟的同时实现了较快的处理速度，并将其应用于急性低血压事件的预测上，取得了较好的效果。

Abstract

The availability of massive healthcare data repositories calls for efficient tools for data-driven medicine. We introduce a distributed system for →

data-driven medicine stratified locality sensitive hashing medical waveform datasets acute hypotensive episode prediction distributed system

发现论文，激发创造

高效的分布式局部敏感哈希

本文提出了基于熵局部敏感哈希的分布式分层哈希方案，能够显著减少网络流量，提高实际应用程序的运行效率。

Oct, 2012

基于私有设备局部敏感哈希的大规模分布式学习

使用新的哈希函数族，开发第一个在设备上具有私密性、个性化和内存效率高的局部敏感哈希框架，实现了隐私和个性化，能够与其他 LSH 框架相竞争，训练大规模推荐网络。

Jun, 2023

DeepLSH：深度局部敏感哈希学习用于快速高效的近似崩溃报告检测

本文研究了如何利用局部敏感哈希（LSH）来解决软件开发过程中自动故障分组的问题，并介绍了 DeepLSH，一种 Siamese DNN 架构和原始损失函数，以逼近 Jaccard 和 Cosine 度量的局部敏感性特性，并通过一系列实验验证了这一方法。

Oct, 2023

密度敏感哈希

提出了一种名为密度敏感哈希（DSH）算法，它是局部敏感哈希（LSH）的扩展，利用数据的几何结构避免了纯随机投影的限制，并在大规模高维数据搜索中取得更好的性能。

May, 2012

常规收集的多变量 ICU 生理信号中的共同潜在表示的协作学习

在重症监护室（ICU）中，多元时间序列的丰富性为机器学习提供了改进患者表型刻画的机会。与以往主要关注电子健康记录（EHR）的研究不同，本文提出了一种使用常规收集的生理时间序列数据进行表型刻画的机器学习方法。我们的新算法将长短期记忆（LSTM）网络与协同过滤的概念相结合，识别出患者之间共同的生理状态。在实际世界的 ICU 临床数据中测试，我们的方法在脑损伤患者颅内高压（IH）检测方面取得了 0.889 的曲线下面积（AUC）和 0.725 的平均精度（AP）。此外，我们的算法在学习生理信号的结构化潜在表示方面优于自编码器。这些发现突显了我们方法在利用常规多元时间序列改善临床护理实践的患者表型刻画方面的巨大潜力。

Feb, 2024

空间感知图像检索：一种用于高效相似哈希的超维度计算方法

我们提出了一种创新的图像哈希方法 NeuroHash，它利用高维计算将空间信息符号编码为高维向量，从而实现空间感知有条件的图像检索。我们的方法将预训练的大型视觉模型与 HDC 操作相结合，实现了空间编码的特征表示。基于局部敏感哈希（LSH）的哈希技术确保了快速高效的图像检索，评估结果显示了图像哈希方法的新进展，提高了检索准确性。

Apr, 2024

LSH 能否被神经网络取代？

利用深度神经网络 (LLSH) 代替传统的局部敏感哈希函数族，该方法能够高效灵活地将高维数据映射到低维空间，并在同时减少时间和内存消耗、保证查询准确性方面展示了可行性，为开发人员设计和配置数据组织提供了新思路，以提高信息搜索性能。通过在不同类型数据集上进行广泛实验，验证了该方法在查询准确性、时间消耗和内存使用方面的优越性。

Oct, 2023

通过张量化的随机投影来改进 LSH

提供了一种基于 CP 和 tensor train (TT) 分解技术的 LSH 方法，适用于欧几里得距离和余弦相似度的张量数据，具有空间高效性。

Feb, 2024

卷积神经网络中使用局部敏感哈希进行即时复杂度降低

通过结构化剪枝方法，利用局部敏感哈希检测通道维度的冗余来压缩潜在特征图，使用 HASTE 模块可以在不需要训练或微调的情况下，即刻降低网络的测试推理成本，有效减少近 47% 的浮点运算量而只损失 1.25% 的准确性。

Sep, 2023

基于局部敏感哈希的高效点变换器在高能物理中的应用

这项研究介绍了一种专为大规模科学领域（如高能物理学和天体物理学）的点云处理优化的新型 Transformer 模型。通过解决图神经网络和标准 Transformer 的局限性，我们的模型整合了局部归纳偏置，并通过硬件友好的规则操作实现了近线性复杂度。本研究的一个贡献是对各种稀疏化技术的误差 - 复杂度权衡进行定量分析，其中发现使用局部敏感哈希（LSH），特别是 OR 和 AND 构造 LSH，在具有局部归纳偏置的大规模点云数据的内核逼近中具有优越性。基于这一发现，我们提出了基于 LSH 的高效点云 Transformer（HEPT），该模型将 E^2LSH 与 OR 和 AND 构造相结合，并基于规则计算进行构建。HEPT 在两个关键但耗时的高能物理任务中表现出色，显著优于现有的 GNN 和 Transformer 模型，在准确性和计算速度上都取得了重大进展，标志着几何深度学习和大规模科学数据处理的重要进步。我们的代码可在 https://github.com/Graph-COM/HEPT 获取。

Feb, 2024