Oct, 2023

化合物的增强聚类和新兴性质的无监督学习分子嵌入

TL;DR分子结构和性质的详细分析具有通过机器学习进行药物开发发现的巨大潜力。我们介绍了用于基于 SMILES 数据检测和聚类化学化合物的各种方法。通过分析化学化合物的图形结构,我们的方法使用向量搜索来满足阈值值,并得到显著而集中的聚簇,该方法在查询和理解化合物方面产生了有利结果。此外,我们还使用存储在向量数据库中的 GPT3.5 的自然语言描述嵌入,优于基本模型。因此,我们引入了一种相似性搜索和聚类算法,以帮助搜索和与分子进行交互,增强化学探索的效率并实现未来在分子属性预测模型中的新发性能的发展。