拓扑增强的机器学习模型 (Top-ML) 用于抗癌肽预测

Jul, 2024

拓扑增强的机器学习模型 (Top-ML) 用于抗癌肽预测

Topology-enhanced machine learning model (Top-ML) for anticancer peptide prediction

Joshua Zhi En Tan, JunJie Wee, Xue Gong, Kelin Xia

TL;DR提出一种基于拓扑增强的机器学习模型 (Top-ML)，用于抗癌肽预测，利用肽序列的连接信息衍生的拓扑特征，通过矢量和谱描述符进行特征化，该模型在两个广泛使用的 AntiCP 2.0 基准数据集上获得了最先进的性能，表明利用新颖的基于拓扑的特征化加速抗癌肽的识别的潜力。

Abstract

Recently, therapeutic peptides have demonstrated great promise for cancer treatment. To explore powerful anticancer peptides, artificial intellig

发现论文，激发创造

基于多模态注意力神经网络的抗癌化合物敏感性预测

本文提出了一种新颖的基于多模态注意力神经网络（PaccMann）预测抗癌化合物敏感性的方法，集成了化合物的分子结构、癌细胞的转录组文件以及关于细胞内蛋白质相互作用的先前知识，通过用SMILES编码的化合物和癌细胞的基因表达谱预测IC50敏感性值，其中基因表达谱采用注意力编码机制编码，通过比较我们设计的模型和基准模型，证明了使用我们的注意力编码器可以超越基准模型，增强了可解释性并使我们能够识别网络用于进行预测的基因、键和原子。

Nov, 2018

TopoTxR: 一种用于预测乳腺癌治疗反应的拓扑生物标志物

本文提出了一种新颖的方法，通过提取具有高显著性的多维拓扑结构，将神经网络的注意力引导到专用的一组体素，从而构建了一种拓扑导出的生物标志物，TopoTxR。实验结果表明，在乳腺癌新辅助化疗反应预测方面，TopoTxR 的有效性优于当前定量方法，且提示治疗前的影像学信息在预测疗效方面具有潜在的作用。

May, 2021

机器学习药物发现中的小分子性质

机器学习在药物发现中预测小分子性质方面具有很大潜力。本文提供了对近年来为此目的引入的各种机器学习方法的综合概述，并对结合亲合力、溶解度和ADMET（吸收、分布、代谢、排泄和毒性）等多个性质预测和优化技术进行了讨论。我们还评估了模型预测方面的技术，特别是在药物发现中关键决策方面提供模型预测理解的技术。总的来说，这篇综述为药物发现中小分子性质预测的机器学习模型提供了深入了解。尽管有多种多样的方法，但它们的性能通常相当。神经网络虽然更加灵活，但并不总是优于更简单的模型。这表明高质量的训练数据对于训练准确的模型仍然至关重要，并且需要标准化的基准、额外的性能指标和最佳实践，以便更好地比较不同技术和模型之间的差异。

Aug, 2023

高效融合词嵌入和深度学习技术用于抗癌肽分类：FastText+BiLSTM

使用字嵌入和深度学习模型的组合，提出了一种高效的抗癌肽分类模型，实验证明该模型能够提高分类准确性，其中FastText+BiLSTM组合在ACPs250数据集上达到92.50%的准确率，在Independent数据集上达到96.15%的准确率，创造了新的最先进模型。

Sep, 2023

肿瘤与药物响应的可解释模型中的跨领域特征解缠

通过域适应网络和特征解耦，本文提出了一种建模肿瘤微环境对临床药物效应影响的方法，并在基准数据集上验证了其在预测临床药物响应和解析肿瘤微环境影响方面的优越性能。

Nov, 2023

多模态表示学习用于分子属性预测：序列、图形、几何

本文提出了一种新的数据增强技术，通过修改分子图的拓扑结构生成具有与原始数据相同的分子连通性索引的增强数据，结合数据增强技术和分子连通性索引能够保留更多基于拓扑结构的分子性质信息并生成更可靠的数据，通过使用五个基准数据集测试表明，基于重要的分子拓扑特征生成的增强数据可以有效提高分子性质的预测准确度，这也为化学信息学研究中的数据增强提供了新的视角。

Jan, 2024

拓扑神经网络的持续性、等变性、连续性

通过结合拓扑神经网络（TNNs）和持久同调（PH）的方法，构建了一种广泛的框架TopNets，扩展了GNNs / TNNs和PH在空间设置中的应用范围，提高了简单消息传递网络的表达能力，并在抗体设计、分子动力学模拟和药物属性预测等各种任务中取得了良好的性能。

Jun, 2024

分子拓扑剖面 (MOLTOP) - 分子图分类的简单而强大的基线

分子图分类的拓扑描述符、特征工程和图神经网络方法的关键词间的关系以及新算法MOLTOP的有效性经如何评估

Jul, 2024

基于数据驱动的拓扑特征学习管道及其在蛋白质稳定性预测中的应用

本研究聚焦于学习生物分子数据的可解释性拓扑特征，以解决传统特征工程不足的问题。我们提出了一种数据驱动的方法，通过与专家主导的物理特征模型比较，展示了基于拓扑特征的模型在预测合成迷你蛋白稳定性方面的有效性。研究结果表明，拓扑特征能提供专家特征未能捕捉的新信息，从而提升模型性能。

Aug, 2024

具有拓扑和静电特征的深度神经网络生物物理模型

本研究针对蛋白质属性预测中的模型不足，提出了一种基于深度学习的生物物理模型。通过多尺度均匀拓扑和静电特征，结合蛋白质结构信息和力场，有效提升了模型的预测精度，显示出在生物分子特性的广泛应用潜力。

Sep, 2024