云上关键事件预测的分布式分层局部敏感哈希
使用新的哈希函数族,开发第一个在设备上具有私密性、个性化和内存效率高的局部敏感哈希框架,实现了隐私和个性化,能够与其他 LSH 框架相竞争,训练大规模推荐网络。
Jun, 2023
本文研究了如何利用局部敏感哈希(LSH)来解决软件开发过程中自动故障分组的问题,并介绍了 DeepLSH,一种 Siamese DNN 架构和原始损失函数,以逼近 Jaccard 和 Cosine 度量的局部敏感性特性,并通过一系列实验验证了这一方法。
Oct, 2023
在重症监护室(ICU)中,多元时间序列的丰富性为机器学习提供了改进患者表型刻画的机会。与以往主要关注电子健康记录(EHR)的研究不同,本文提出了一种使用常规收集的生理时间序列数据进行表型刻画的机器学习方法。我们的新算法将长短期记忆(LSTM)网络与协同过滤的概念相结合,识别出患者之间共同的生理状态。在实际世界的 ICU 临床数据中测试,我们的方法在脑损伤患者颅内高压(IH)检测方面取得了 0.889 的曲线下面积(AUC)和 0.725 的平均精度(AP)。此外,我们的算法在学习生理信号的结构化潜在表示方面优于自编码器。这些发现突显了我们方法在利用常规多元时间序列改善临床护理实践的患者表型刻画方面的巨大潜力。
Feb, 2024
我们提出了一种创新的图像哈希方法 NeuroHash,它利用高维计算将空间信息符号编码为高维向量,从而实现空间感知有条件的图像检索。我们的方法将预训练的大型视觉模型与 HDC 操作相结合,实现了空间编码的特征表示。基于局部敏感哈希(LSH)的哈希技术确保了快速高效的图像检索,评估结果显示了图像哈希方法的新进展,提高了检索准确性。
Apr, 2024
利用深度神经网络 (LLSH) 代替传统的局部敏感哈希函数族,该方法能够高效灵活地将高维数据映射到低维空间,并在同时减少时间和内存消耗、保证查询准确性方面展示了可行性,为开发人员设计和配置数据组织提供了新思路,以提高信息搜索性能。通过在不同类型数据集上进行广泛实验,验证了该方法在查询准确性、时间消耗和内存使用方面的优越性。
Oct, 2023
通过结构化剪枝方法,利用局部敏感哈希检测通道维度的冗余来压缩潜在特征图,使用 HASTE 模块可以在不需要训练或微调的情况下,即刻降低网络的测试推理成本,有效减少近 47% 的浮点运算量而只损失 1.25% 的准确性。
Sep, 2023
这项研究介绍了一种专为大规模科学领域(如高能物理学和天体物理学)的点云处理优化的新型 Transformer 模型。通过解决图神经网络和标准 Transformer 的局限性,我们的模型整合了局部归纳偏置,并通过硬件友好的规则操作实现了近线性复杂度。本研究的一个贡献是对各种稀疏化技术的误差 - 复杂度权衡进行定量分析,其中发现使用局部敏感哈希(LSH),特别是 OR 和 AND 构造 LSH,在具有局部归纳偏置的大规模点云数据的内核逼近中具有优越性。基于这一发现,我们提出了基于 LSH 的高效点云 Transformer(HEPT),该模型将 E^2LSH 与 OR 和 AND 构造相结合,并基于规则计算进行构建。HEPT 在两个关键但耗时的高能物理任务中表现出色,显著优于现有的 GNN 和 Transformer 模型,在准确性和计算速度上都取得了重大进展,标志着几何深度学习和大规模科学数据处理的重要进步。我们的代码可在 https://github.com/Graph-COM/HEPT 获取。
Feb, 2024