基于云计算的实时分子筛选平台与 MolFormer
本文提出了一种多视图方法,将来自最先进化学模型的潜在空间进行结合,其中使用了基于 MHG-GNN 的嵌入(将分子结构表示为图形)和根植于化学语言的 MoLFormer 嵌入。我们通过在六个基准数据集上评估该方法,证明了我们所提出的多视图方法在预测临床试验药物毒性和抑制 HIV 复制等复杂任务上,优于现有的最先进方法,包括在 11 亿个分子上进行训练的 MoLFormer-XL。研究结果突显了潜在空间融合和特征整合在推进分子属性预测方面的潜力。
Oct, 2023
本文介绍了一种新颖的多模态语言模型方法,结合化学语言表征和物理化学特征,以预测分子性质。我们的方法使用因果多阶段特征选择方法,在 MOLFORMER 生成的分子嵌入向量空间中,将这些因果特征与物理化学特征相结合。我们的结果表明,与现有的化学语言模型 MOLFORMER 和图形神经网络相比,在预测生物降解性和 PFAS 毒性估计等复杂任务方面,我们的提出的方法表现更优秀。此外,我们证明了我们的特征选择方法可以在保持或提高模型性能的同时降低 Mordred 特征空间的维数。这一方法为未来的分子性质预测研究开辟了有 promising avenues。
Jun, 2023
SELFormer 是一种基于变压器架构的化学语言模型,利用 100%有效,紧凑和自我表达符号 SELFIES 作为输入来学习灵活且高质量的分子表示方法,并可以发现隐藏在数据中的知识, 这种方法在药物发现中具有很大的潜力。
Apr, 2023
通过引入 GIT-Mol 和 GIT-Former,我们开发了一种创新的任意类型到语言的分子翻译策略,并在分子字幕生成方面实现了 10%-15% 的改进,在属性预测方面提高了 5%-10% 的准确性,并且在分子生成有效性方面提高了 20%。
Aug, 2023
本文提出了一种基于自然语言描述和编辑目标分子的新型任务,即 “对话式分子设计”,并设计了一个通用的 ChatMol 模型,它采用了大规模语言模型和化学知识相结合的技术,来实现将自然语言和化学语言相互转换在分子领域的应用。
Jun, 2023
科学语言模型在分子发现中的作用及其在药物设计、性质预测和反应化学中的优势,以及通过降低科学语言建模领域的门槛来加速化学发现,并提出结合聊天机器人界面和计算化学工具的分子设计愿景。
Sep, 2023
本文介绍了一个基于云平台的系统,旨在通过共享原始数据和云端快速后处理来提取用户定义的新特性,以实现计算材料科学社区的数据共享和新见解。
Aug, 2022
训练数据记忆和新颖性受训练数据质量影响;GP-MoLFormer 可用于生成新颖、有效且独特的分子;在三个不同任务上,GP-MoLFormer 表现良好或相当,展示了它的通用性。
Apr, 2024
通过将语言模型视为代理和分子预训练模型视为知识库,我们提出了一种新颖的方法,称为 MolTailor,它可以通过理解任务的自然语言描述来强调分子表示中与任务相关的特征,从而提高预测性能。通过评估,我们证明了 MolTailor 相较于基线模型表现出更好的性能,验证了增强分子表示学习相关性的有效性,展示了语言模型引导优化的潜力,以更好地利用和释放现有强大的分子表示方法的能力。
Jan, 2024