拓扑增强的机器学习模型 (Top-ML) 用于抗癌肽预测
本文提出了一种新颖的基于多模态注意力神经网络(PaccMann)预测抗癌化合物敏感性的方法,集成了化合物的分子结构、癌细胞的转录组文件以及关于细胞内蛋白质相互作用的先前知识,通过用SMILES编码的化合物和癌细胞的基因表达谱预测IC50敏感性值,其中基因表达谱采用注意力编码机制编码,通过比较我们设计的模型和基准模型,证明了使用我们的注意力编码器可以超越基准模型,增强了可解释性并使我们能够识别网络用于进行预测的基因、键和原子。
Nov, 2018
本文提出了一种新颖的方法,通过提取具有高显著性的多维拓扑结构,将神经网络的注意力引导到专用的一组体素,从而构建了一种拓扑导出的生物标志物,TopoTxR。实验结果表明,在乳腺癌新辅助化疗反应预测方面,TopoTxR 的有效性优于当前定量方法,且提示治疗前的影像学信息在预测疗效方面具有潜在的作用。
May, 2021
机器学习在药物发现中预测小分子性质方面具有很大潜力。本文提供了对近年来为此目的引入的各种机器学习方法的综合概述,并对结合亲合力、溶解度和ADMET(吸收、分布、代谢、排泄和毒性)等多个性质预测和优化技术进行了讨论。我们还评估了模型预测方面的技术,特别是在药物发现中关键决策方面提供模型预测理解的技术。总的来说,这篇综述为药物发现中小分子性质预测的机器学习模型提供了深入了解。尽管有多种多样的方法,但它们的性能通常相当。神经网络虽然更加灵活,但并不总是优于更简单的模型。这表明高质量的训练数据对于训练准确的模型仍然至关重要,并且需要标准化的基准、额外的性能指标和最佳实践,以便更好地比较不同技术和模型之间的差异。
Aug, 2023
使用字嵌入和深度学习模型的组合,提出了一种高效的抗癌肽分类模型,实验证明该模型能够提高分类准确性,其中FastText+BiLSTM组合在ACPs250数据集上达到92.50%的准确率,在Independent数据集上达到96.15%的准确率,创造了新的最先进模型。
Sep, 2023
通过域适应网络和特征解耦,本文提出了一种建模肿瘤微环境对临床药物效应影响的方法,并在基准数据集上验证了其在预测临床药物响应和解析肿瘤微环境影响方面的优越性能。
Nov, 2023
本文提出了一种新的数据增强技术,通过修改分子图的拓扑结构生成具有与原始数据相同的分子连通性索引的增强数据,结合数据增强技术和分子连通性索引能够保留更多基于拓扑结构的分子性质信息并生成更可靠的数据,通过使用五个基准数据集测试表明,基于重要的分子拓扑特征生成的增强数据可以有效提高分子性质的预测准确度,这也为化学信息学研究中的数据增强提供了新的视角。
Jan, 2024
通过结合拓扑神经网络(TNNs)和持久同调(PH)的方法,构建了一种广泛的框架TopNets,扩展了GNNs / TNNs和PH在空间设置中的应用范围,提高了简单消息传递网络的表达能力,并在抗体设计、分子动力学模拟和药物属性预测等各种任务中取得了良好的性能。
Jun, 2024
本研究聚焦于学习生物分子数据的可解释性拓扑特征,以解决传统特征工程不足的问题。我们提出了一种数据驱动的方法,通过与专家主导的物理特征模型比较,展示了基于拓扑特征的模型在预测合成迷你蛋白稳定性方面的有效性。研究结果表明,拓扑特征能提供专家特征未能捕捉的新信息,从而提升模型性能。
Aug, 2024
本研究针对蛋白质属性预测中的模型不足,提出了一种基于深度学习的生物物理模型。通过多尺度均匀拓扑和静电特征,结合蛋白质结构信息和力场,有效提升了模型的预测精度,显示出在生物分子特性的广泛应用潜力。
Sep, 2024