基于远程标注和置信度校准的大规模蛋白质翻译后修饰抽取

Jan, 2022

基于远程标注和置信度校准的大规模蛋白质翻译后修饰抽取

Large-scale protein-protein post-translational modification extraction with distant supervision and confidence calibrated BioBERT

PDF

Aparna Elangovan, Yuan Li, Douglas E. V. Pires, Melissa J. Davis, Karin Verspoor

TL;DR在这项研究中，作者使用 IntAct PPI 数据库创建了一个远程监督的数据集，用 PPI-BioBERT-x10 训练集成的 BioBERT 模型来预测蛋白质对之间的 PTMs，并提出一个置信度校准的方法以对其进行过滤和人工筛选。他们发现，即使进行了置信度校准，也会出现在测试数据集外的误差和挑战。因此，他们利用多篇文章进行预测，从而提高了预测的精度和可靠性。这项研究探讨了深度学习方法在文本挖掘中的应用和局限性，同时强调了在人工筛选过程中置信度校准的重要性。

Abstract

protein-protein interactions (PPIs) are critical to normal cellular function and are related to many disease pathways. However, only 4% of PPIs are annotated with ptms in biological knowledge databases such as In

protein-protein interactions ptms biobert models confidence calibration text mining

发现论文，激发创造

使用 PubMed 摘要的基于 BioBERT 的弱监督方法将功能分配给蛋白质相互作用

使用基于 BioBERT 的深度学习技术从 PubMed 文摘中提取蛋白质相互作用 (PPI) 的功能类型，对这些信息进行标注。这项工作证明了通过对生物医学文摘的分析，可以大规模提高在线数据库中带有功能注释的蛋白质相互作用的数量。

Aug, 2020

基于 GPT 和 BERT 模型在生物医学文本中识别蛋白质相互作用的评估

该论文研究了使用 GPT 和 BERT 模型在生物医学文本中检测蛋白质相互作用，结果发现 GPT 模型能够在生物医学文献挖掘任务中有效地检测 PPI，并且具有潜力。

Mar, 2023

利用基于注意力的关系上下文信息从生物医学文献中提取蛋白质相互作用（PPIs）

通过多源蛋白质相互作用数据集，利用基于 Transformer 的深度学习方法改善关系提取表现，从而协助理解生物系统中的疾病发展、基因 / 蛋白质功能和生物过程。

Mar, 2024

利用 PPI 检索进行高效的蛋白质相互作用研究

利用已有的蛋白质相互作用数据，在嵌入空间中有效搜索潜在的蛋白质相互作用，并在形成蛋白质复合物的过程中，有效地识别潜在的结合伴侣以及其相应的结合位点。

Feb, 2024

提升泛化能力的蛋白质相互作用设计学习

通过构建 PPIRef 数据集和使用 PPIformer 模型，本研究发现可以提高蛋白质 - 蛋白质相互作用的突变并表明其在仿真药物研究和疗法改进中的潜力。

Oct, 2023

通过校准的深度神经网络和自我训练提取化学物质 - 蛋白质相互作用

提出一种基于 DNN 的方法，结合了不确定性信息和校准技术来提取化学物质 - 蛋白质之间的相互作用。该方法能够估算数据不确定性并提高模型可靠性，同时改善性能并保持高校准能力。

Nov, 2020

ContactNet：基于几何的深度学习模型用于预测蛋白质 - 蛋白质相互作用

我们开发了一种基于注意力的图神经网络 (ContactNet)，用于将从对接算法中得到的蛋白质相互作用模型分类为准确和错误的模型，不需要多序列比对，适用于其他类型的相互作用。

Jun, 2024

低数据环境中蛋白质 - 肽接口预测的改进

本研究提出了一种新颖的生物模态转换器，通过学习残余联系的界面联合分布来预测蛋白质 - 肽相互作用，并采用来自 PepBDB 和 PDB 的伪蛋白质 - 肽复合物的扩充数据集实现数据扩充，使用神经网络进行训练以代替模板建模方法，从而增加了模型的预测能力。

May, 2023

利用高斯概率分布和外部生物医学知识进行化学物质 - 蛋白质相互作用提取

本文提出了一种基于神经网络、BERT 和高斯概率分布的方法，以改进在生物医学文献中提取化学物质 - 蛋白质相互作用的性能，该方法能够充分利用局部结构和外部医学知识，并在实验中取得了比其他最先进方法更好的结果。

Nov, 2019

利用树状 LSTM 和结构化注意力识别蛋白质相互作用

本文提出了一种基于树的循环神经网络与结构化注意架构来识别蛋白质相互作用的方法，无需手动提取特征，实现了在 AIMed 和 BioInfer 基准数据集上的最优结果，并显著提高了以往最好模型的性能。此外，与传统循环网络相比，树状循环网络在监督 PPI 问题上表现更好。

Jul, 2018