基于 GC-EI-MS 光谱的小分子的去新识别
这篇研究论文应用了人工智能技术分析质谱数据,用于检测古代火星的适居潜力,并探讨了该方法在质谱学和其他领域的适用性。
Oct, 2023
AdaNovo 是一个新颖的框架,通过计算光谱与每个氨基酸 / 肽之间的条件互信息(CMI),利用 CMI 进行自适应模型训练,以解决串级质谱在鉴定具有后转录修饰的氨基酸时遇到的挑战,并且在鉴定肽和抗数据噪声方面表现出色。
Mar, 2024
本文介绍了第一个统一的鲁棒性肽段测序标准 NovoBench,该标准包括多样的质谱数据、整合模型和全面的评估指标,并通过对各种因素的评估,揭示了许多有启发性的发现,为未来的发展开辟了新的可能性。
Jun, 2024
本文提出了一种基于机器学习的策略来预测分子红外光谱的方法,建立在从头分子动力学模拟的基础上,利用各种机器学习技术加速模拟并扩展可处理的系统大小,其中包括环境依赖性神经网络电荷的分子偶极矩模型和 Behler 和 Parrinello 的神经网络势能。通过引入完全自动化的采样方案和神经网络势能训练期间的分子力,我们能够仅基于少量的电子结构参考点来获得非常精确的机器学习模型,同时在甲醇分子,含有多达 200 个原子的正构烷和质子化的丙氨酸三肽的情况下,将其应用于模拟红外光谱,并发现与理论和实验光谱具有出色的一致性。
May, 2017
Casanovo-DIA 是一种基于 Transformer 架构的深度学习模型,能够从 DIA 质谱数据中解析肽段序列,并显著提高了已有方法的精度和召回率,在氨基酸水平上精度提高 15.14% 至 34.8%,召回率提高 11.62% 至 31.94%,在肽段水平上精度提高 59% 至 81.36%。将 DIA 数据与 Casanovo-DIA 模型集成能够大大提升对生物样本的肽段发现和全面性分析。
Feb, 2024
本文介绍了一种基于机器学习和神经网络的代谢物注释模型 ——Ensemble Spectral Prediction (ESP),该模型通过加权 MLP 和 GNN 光谱预测器的输出来生成查询分子的光谱预测,可提高注释能力的 41% 和 30%,是目前神经网络方法中性能最优秀的模型之一,并在实验中验证了候选分子的相似性和数量对注释性能的影响。
Mar, 2022
通过将气相色谱 - 离子迁移谱(GC-IMS)数据与机器学习算法整合到一个统一的实验室信息管理系统(LIMS)平台中,我们的研究目标在于解决精确感染识别的持续问题,为先进诊断技术领域做出贡献,并通过不同的机器学习算法区分感染和非感染样本,以支持疾病的早期检测。
Apr, 2024
ContraNovo 算法是一种创新算法,通过对质谱和肽段之间的关系进行对比学习,并将质量信息纳入肽段解码,从而更高效地解决肽段测序问题,并在两个基准数据集上得到了可靠的结果,显示出其在提升新肽段测序中的潜力。
Dec, 2023
本文基于生成对抗生成模型的对数似然梯度,介绍利用一种基于动态贝叶斯网络(DBN)的核判别分类器改进 Tandem Mass Spectrometry 中蛋白质识别的方法,通过引入 Theseus DBN 搜索算法,实现了自动学习模型参数的功能,并在评估数据集上取得了最优效果的结果。
Sep, 2019