Dec, 2023
ESM-NBR:通过蛋白质语言模型特征表示和多任务学习的快速准确核酸结合残基预测
ESM-NBR: fast and accurate nucleic acid-binding residue prediction via protein language model feature representation and multi-task learning
Wenwu Zeng, Dafeng Lv, Wenjuan Liu, Shaoliang Peng
TL;DR通过使用 ESM2 作为输入,ESM-NBR 提出了一种快速准确的序列 - based 方法,采用由双向长短期记忆和多层感知器网络组成的深度学习模型,探索 DNA 和 RNA 结合残基的共有和私有信息。在基准数据集上的实验证明,ESM2 特征表征的预测性能全面优于基于进化信息的隐马尔可夫模型(HMM)特征。此外,ESM-NBR 的预测速度远远超过现有方法(用于 500 个蛋白质序列的时间为 5.52 秒,比第二快的方法快约 16 倍)。