- FABind+: 提升分子对接的口袋预测和位姿生成
FABind + 是一种基于深度学习的增强迭代方法,通过改进口袋预测和姿态生成模块,以及引入采样技术和置信度模型,大幅提升了分子对接和药物发现的性能。
- Leap:中间体辅助的分子合成可行性评分
该研究通过 GPT-2 模型来预测化合物的合成路径,并综合考虑关键中间体的可用性,从而在鉴别可合成分子时表现出色,与其他评分方法相比,AUC 分数至少提高 5%。
- MolBind:语言、分子和蛋白质的多模态对齐
生物学和化学领域的最新进展已经利用多模态学习,将分子及其自然语言描述整合到药物发现中。然而,当前的预训练框架局限于两种模态,并且设计一个能够处理不同模态(如自然语言、2D 分子图、3D 分子构象和 3D 蛋白质)的统一网络仍具有挑战性。在这 - AAAI基于扩散语言模型的文本引导分子生成
本文介绍了一种基于扩散语言模型的文本导向分子生成方法 (TGM-DLM),该方法在生成具有特定文本描述的分子时克服了自回归方法的局限性,并通过两阶段的扩散生成过程共同和迭代地更新 SMILES 字符串中的标记嵌入。实验证明,TGM-DLM - MFBind:一种多保真度方法用于在实际生成建模中评估药物化合物
当前药物发现的生成模型主要使用分子对接来评估生成化合物的质量,但这种模型在实践中往往无用,因为即使具有较高对接分数的化合物也未必总是显示实验活性。我们提出了一种多保真度的方法,Multi-Fidelity Bind (MFBind),以实现 - 利用大型语言模型在药物分子和适应症之间进行翻译的新机遇
药物分子和适应症之间的翻译是一个新颖的任务,本文评估了九种 T5 大型语言模型在此任务上的表现,并讨论了未来的改进方向。
- 领域知识和多模态对智能分子性质预测的影响:一项系统调查
综合审视和数量分析基于各种基准的最新深度学习方法,我们发现融合分子信息不仅能提高分子属性预测回归和分类任务的准确性,还能通过同时利用 1 维和 2 维信息的 3 维信息大幅增强分子属性预测进展,在药物研发中具有重要指导意义。
- 分子属性预测的图多相似性学习
我们提出了图形多相似学习(GraphMSL)框架,它在连续尺度上捕捉了分子的自相似性和相对相似性,从而显著提高了分子性质预测中的表示学习的效果。此框架通过不同化学模态推导出单峰多相似性度量,融合这些度量到多模态形式中,灵活的融合函数可以重塑 - 药物靶标相互作用的大型数据集整理和基准
通过从多个公共数据源中创建和有效展示大规模数据集、基于不同有意义的策略将数据划分为训练、验证和测试集,并提供具体评估方案进行基准测试,本文提出了标准化已有数据资源的方法,并通过对现有神经网络模型的实验研究证明了其实用性和可行性。
- AAAIMolTailor: 通过文本提示定制化化学分子表征以执行特定任务
通过将语言模型视为代理和分子预训练模型视为知识库,我们提出了一种新颖的方法,称为 MolTailor,它可以通过理解任务的自然语言描述来强调分子表示中与任务相关的特征,从而提高预测性能。通过评估,我们证明了 MolTailor 相较于基线模 - TwinBooster:借助 Barlow Twins 和梯度提升加强分子属性预测
通过深度学习在药物发现领域的应用中,通过集成生物测定和分子指纹提取真正的分子信息,加速早期活性分子的识别,有助于简化新型药物的鉴定。
- 生物信息学中的大型语言模型:应用与展望
大型语言模型在生物信息学领域具有巨大潜力和前景,广泛应用于基因组学、转录组学、蛋白质组学、药物发现和单细胞分析等多个层面的生物信息学问题。
- DrugAssist:一个用于分子优化的大型语言模型
通过人机对话,结合大型语言模型的强交互性和泛化性,提出了 DrugAssist,一个用于分子优化的交互式模型,成功在单一和多个性能优化方面取得了领先的结果,同时展示了潜在的可迁移性和迭代优化的巨大潜力。
- 药物设计的奖励函数配置自动化
设计奖励函数以引导生成分子设计算法到化学空间中的可取区域对于基于人工智能的药物发现至关重要。我们提出了一种基于实验数据的自动奖励配置方法,通过构建基于帕累托优势的实验数据排序,并训练神经网络以近似奖励函数,使得预测奖励相关的排序与基于帕累托 - 对手性敏感的分子性质预测的 SE (3)- 不变多参数持久同调
通过结合关于分子手性的 SE (3) 不变性和 Vietoris-Rips 持久同调,我们提出了一种用于生成分子指纹的新型计算方法。该方法在药物发现和材料科学中具有重要意义,能精确预测分子性质。我们通过应用 Vietoris-Rips 持久 - 分子联合自编码:2D 和 3D 扩散下的轨迹预训练
该研究提出了一种面向分子联合自编码(MoleculeJAE)的预训练方法,该方法可以学习分子的二维键和三维构象信息,通过扩增轨迹的弥散过程模型,MoleculeJAE 能够以自我监督的方式学习分子的化学结构,优于与其相比的 12 个竞争基准 - HeTriNet:药物 - 靶点 - 疾病相互作用的异构图三元注意力网络
通过构建一个异构图,并引入新的三元关注机制,我们开发了一种名为 HeTriNet 的模型,可以更好地理解药物 - 靶标 - 疾病之间的相互作用,并在预测这种三元关系问题上显示出了出色的性能。
- 无目标复合物活性预测:基于少样本学习
设计了一种新颖的神经网络结构,以元学习大规模生物活性数据集上的连续化合物活性,并通过聚合已知化合物及其活性产生的编码来捕捉测定结果的信息。与传统的基于相似性的技术以及其他领先的少样本学习方法相比,FS-CAP 在各种无靶标药物发现设置和数据 - InstructMol: 用于药物发现中构建多模态集成的多功能可靠分子助手
通过一种多模态的大型语言模型 InstructMol,将分子结构与自然语言有效地对齐,通过一种指令调整方法,利用有限的领域特定数据与分子和文本信息相结合的两阶段训练策略,展示了在药物发现相关的分子任务上的显著性能改进,超过了领先的大型语言模 - 基于回归的多模态单细胞数据整合策略分析
利用多模式单细胞技术,通过整合不同数据类型并建模模态之间的相互关系,为疾病生物标志物检测和药物发现提供了改进,实验结果表明机器学习技术对于建模细胞发展中 DNA 到 RNA 及蛋白质之间的协变性具有显著效果,有望推动对细胞分化和功能的理解并