Feb, 2024

利用低维分子嵌入进行快速化学相似性搜索

TL;DR在化学中,最邻近基于相似性搜索是一项常见任务,但其中一些常用方法仍然采用蛮力算法。本研究评估了低维化学嵌入和 k-d 树数据结构相结合的方法,能在标准化学相似性搜索基准下实现快速最近邻查询,并证明了这种方法在超过十亿种化学物质的搜索中,仅用一个 CPU 核心能在一秒钟内执行,比蛮力算法快五个数量级,并且在化学相似性基准中表现出竞争性能。