PGraphDTA: 利用蛋白质语言模型和接触图改进药物靶点相互作用预测
通过使用 fine-tuned 预训练生成型小语言模型 (SLM),我们描述了准确预测配体 - 蛋白相互作用 (LPI) 亲和度,也称为药物靶点相互作用 (DTI)。我们在无样本设置中针对与配体 - 蛋白相互作用相关的一系列亲和度值进行了准确的预测。模型输入只使用了配体的 SMILES 化学式和蛋白氨基酸序列。我们的结果表明,在准确预测一系列配体 - 蛋白相互作用亲和度方面,与基于机器学习 (ML) 和自由能扰动 (FEP+) 方法相比,我们取得了明显的改进,这可以加速针对具有挑战性的治疗靶点的药物发现项目。
Jun, 2024
药物靶标作用(DTI)预测是药物发现过程中的关键组成部分。本文提出了一种双通道网络结构的交叉领域监督学习模型 SiamDTI,通过跨领域信息融合策略获取局部和全局蛋白质信息,并在三个基准数据集上实验证明 SiamDTI 在预测新药物和靶标方面具有较高的准确性。
May, 2024
本研究提出了一种基于概率软逻辑(PSL)的网络药物 - 靶位点相互作用预测方法,通过多源信息的异质网络,包括药物相似性、靶位点相似性、药物 - 靶位点相互作用和其他潜在信息,利用元路径计数代替路径实例来降低 PSL 规则实例的数量。实验结果表明,该方法在 AUPR 和 AUC 分数方面优于其他五种方法。
Jun, 2023
本研究提出了一种新颖的 DTA 预测方法,名为 HGTDP-DTA,该方法利用混合图转换器框架中的动态提示,生成每个药物 - 靶点对的上下文特定提示,进而增强模型捕捉独特的相互作用,并采用多视图特征融合方法将分子图视图和亲和子图视图投影到一个公共特征空间,从而高效地结合了结构和上下文信息。实验结果表明,HGTDP-DTA 在预测性能和泛化能力方面均优于现有的 DTA 预测方法。
Jun, 2024
本研究提出通过预测物理信息方程中的原子间相互作用并将其总和用于蛋白质 - 配体复合物的结合亲和力,以增强深度神经网络(DNN)药物靶标交互模型的泛化能力,并通过扩大训练数据的结合位姿和配体来改进模型的泛化能力物。通过可视化配体亚结构的贡献,这种物理信息策略为进一步配体优化提供了见解。我们的模型 PIGNet 在 CASF2016 比较评估中得到验证,表现出优于以前方法的对接和筛选能力。
Aug, 2020
该研究通过对当前的药物靶标相互作用预测数据集和预测模型进行深入评估,发现基于推导模型的药物靶标相互作用预测方法缺乏泛化性,已有的评估方法导致性能夸大,因此不适用于药物再利用方法。鉴于此,提出了一种新颖的生物学驱动的负边缘子采样策略,并通过体外验证表明新发现的相互作用确实是真实的。该研究为未来公平的基准测试和稳健的模型设计奠定了基础。所有生成的资源和工具都作为 Python 软件包公开可用。
Nov, 2023
本研究提出了一种名为 FusionDTI 的新模型,通过使用 SELFIES 表示药物和结构感知的目标蛋白质词汇,以及利用预训练的语言模型捕捉复杂信息,有效地学习药物 - 靶蛋白交互的细粒度信息,并在三个著名基准数据集上展现出与七种现有模型相比最佳的 DTI 预测性能,进一步突显了 FusionDTI 在 DTI 预测中的潜在结合位点和提高可解释性。
Jun, 2024
使用四种基于文本的信息源 —— 蛋白质序列、配体 SMILES、蛋白质结构域和模体以及最大公共子结构单词预测结合亲和力,同时证明了基于单词的序列表示法是预测结合亲和力的深度学习模型的一种有前途的替代方法。
Feb, 2019
我们开发了一种基于注意力的图神经网络 (ContactNet),用于将从对接算法中得到的蛋白质相互作用模型分类为准确和错误的模型,不需要多序列比对,适用于其他类型的相互作用。
Jun, 2024