AMPCliff: 抗微生物肽中活性断崖的定量定义和基准评估

Apr, 2024

AMPCliff: 抗微生物肽中活性断崖的定量定义和基准评估

AMPCliff: quantitative definition and benchmarking of activity cliffs in antimicrobial peptides

Kewei Li, Yuqian Wu, Yutong Guo, Yinheng Li, Yusi Fan...

TL;DR在这项研究中，我们介绍了一种用于定量化定义和评估抗菌肽中的活性悬崖现象的基准框架 (AMPCliff)，并发现机器学习模型在检测活性悬崖事件方面具有良好性能。

Abstract

activity cliff (AC) is a phenomenon that a pair of similar molecules differ by a small structural alternation but exhibit a large difference in their biochemical activities. The AC of small molecules has been extensively investigated but limited knowledge is accumulated about the AC ph

activity cliff antimicrobial peptides benchmarking framework machine learning predictive performance

发现论文，激发创造

基于图形的主动机器学习方法用于生成和选择多样和新颖的抗菌肽

本篇论文旨在利用一种基于机器学习的框架快速有效地筛选出新的抗菌肽，其中利用了基于循环神经网络和基于图形的过滤器，从而显著减少湿实验的次数和时间成本。

Sep, 2022

人工智能驱动的抗菌肽发现

抗菌肽（AMP）和人工智能（AI）在抗菌耐药性方面有着巨大的潜力，提供了一种替代传统抗生素的方法。本文综述了 AI 驱动的 AMP 发现的最新成就，并强调了最激动人心的方向。

Aug, 2023

HMAMP：基于超体积的多目标抗菌肽设计

通过考虑多个属性，提出了一种名为 HMAMP 的新颖方法，将强化学习和基于超体积最大化概念的梯度下降算法相结合，以实现多属性抗微生物肽的同时优化。该方法生成了一系列平衡多种属性的潜在抗微生物肽候选者，并确定了这些候选者的 Pareto 前沿中的关键点。实证结果证实，HMAMP 设计的抗微生物肽具有竞争性能和增强的多样性，而对十个潜在候选抗微生物肽的螺旋结构和分子动力学模拟的详细分析验证了 HMAMP 在多属性抗微生物肽设计领域的优越性。HMAMP 能够系统地设计考虑多个属性的抗微生物肽，标志着建立一个通用的计算框架，用于多目标抗微生物肽设计的开创性里程碑。

May, 2024

ACP-ESM：一种基于蛋白定向变压器方法的抗癌肽分类的新型框架

提出了一种高效的基于 Transformer 的框架，利用 ESM、ProtBert、BioBERT 和 SciBERT 四种不同的 Transformer 模型从氨基酸序列中检测抗癌肽，实验证明该模型在准确率上优于现有研究，为抗癌肽研究确定了新的最先进水平。

Jan, 2024

PepCVAE: 抗微生物肽序列的半监督目标设计

本论文提出了基于半监督变分自编码器模型的 Peptide Generation Framework（PepCVAE），用于设计新型抗菌肽（AMP）序列，通过大量未标记的肽序列学习一种丰富的生物肽上下文的潜在空间，同时通过 AMP 分类器的反馈学习出一种分离的抗菌属性空间，生成的 AMP 序列表现优于标准 VAE，具有高度多样性，是下一代抗菌设计中非常理想的选择。

Oct, 2018

高效融合词嵌入和深度学习技术用于抗癌肽分类：FastText+BiLSTM

使用字嵌入和深度学习模型的组合，提出了一种高效的抗癌肽分类模型，实验证明该模型能够提高分类准确性，其中 FastText+BiLSTM 组合在 ACPs250 数据集上达到 92.50% 的准确率，在 Independent 数据集上达到 96.15% 的准确率，创造了新的最先进模型。

Sep, 2023

MAPE-PPI: 通过微环境感知蛋白质嵌入实现高效有效的蛋白质相互作用预测

通过定义氨基酸残基的序列和结构上下文，我们提出了一种微环境感知的蛋白质嵌入（MPAE-PPI）方法，将微环境编码为具有足够大的词汇（例如代码本）的化学有意义的离散代码，用于高效的大规模蛋白质相互作用（PPI）预测。经过广泛实验表明，MPAE-PPI 可以在 PPI 预测中高效而有效地处理数百万个 PPI，具有优异的效果和计算效率。

Feb, 2024

SIU: 百万级结构化小分子 - 蛋白质相互作用数据集用于无偏生物活性预测

这项研究介绍了一个包含超过一百万个结合结构及其真实生物活性标签的小分子 - 蛋白质相互作用全面数据集，用于推动无偏生物活性预测，并评估了几种经典模型在该数据集上的效果，结果表明无偏生物活性预测任务既具有挑战性又是必不可少的。

Jun, 2024

pLMFPPred: 一种准确预测功能肽的新方法，结合了从预训练蛋白质语言模型中嵌入和不平衡学习

利用基于蛋白质语言模型的嵌入（ESM-2），我们开发了一个名为 pLMFPPred（蛋白质语言模型功能肽预测器）的工具，用于预测功能性肽并识别有毒肽，同时引入了 SMOTE-TOMEK 数据合成采样和 Shapley 值基于特征选择技术以缓解数据不平衡问题和减少计算成本。在经过验证的独立测试集上，pLMFPPred 分别取得了 0.974、0.99 和 0.974 的准确率、曲线下面积（AUC-ROC）和 F1-Score 值，比当前用于预测功能性肽的方法表现更优。实验结果表明，提出的方法（pLMFPPred）在准确性、曲线下面积（AUC-ROC）和 F1-Score 等方面具有更好的性能，是一种用于预测功能性肽的新的计算方法。

Sep, 2023

CREMP: 微环肽的构象 - 旋转异构体集 (Conformer-Rotamer Ensembles) 用于机器学习

通过深度学习模型，我们构建了一个包含 36198 个高质量的结构模型、大约 31.3 百万个不同的宏环几何特征以及使用半经验扩展紧束缚 DFT 计算得到的能量注释，该数据集被用于宏环肽类药物的设计和优化。

May, 2023