- 面向目标的多模态蛋白质表示学习的配体生成的变分自编码器
这篇研究论文介绍了一种名为 TargetVAE 的目标感知变分自编码器,它能够根据蛋白质目标,通过使用基于图变换器的新颖多模态深度神经网络作为生成模型的先验,产生具有高结合亲和力的配体,从而在药物发现中减小潜在药物候选的搜索空间。
- 轻量级对比蛋白质结构序列变换
本文提出了一种用于蛋白质结构表示预训练的新型无监督方法,该方法利用现有的预训练语言模型通过无监督的对比对齐指导结构模型的学习,并提出了一种自监督的结构约束来进一步学习结构的内部信息。实验结果表明,该方法的性能在多个任务和特定数据集上均表现出 - 用分子力场进行可微转角采样
本文介绍一种基于神经网络的 Boltzmann 生成器,以取代传统 molecular dynamics 方法,加速复杂大分子如蛋白质的能量表面探索。
- 蛋白质结构感知的自监督学习
我们提出了一种新颖的结构感知的蛋白自监督学习方法,利用图神经网络模型预训练,从残基距离和二面角的角度考虑自监督学习任务,借鉴预训练蛋白语言模型的序列信息结合专门设计的 GNN 模型的结构信息进行伪二级优化,实验证明该方法在多个监督型下游任务 - KDD利用大规模预训练语言模型建模蛋白质
使用大规模的语言模型,可以从蛋白质序列中准确捕捉到进化信息,并在标记层和序列层任务中取得了显着的改进。
- EMNLP通过校准的深度神经网络和自我训练提取化学物质 - 蛋白质相互作用
提出一种基于 DNN 的方法,结合了不确定性信息和校准技术来提取化学物质 - 蛋白质之间的相互作用。该方法能够估算数据不确定性并提高模型可靠性,同时改善性能并保持高校准能力。
- EMNLPVapur:COVID-19 文献中相关蛋白质 - 化合物对的搜索引擎
Vapur 是一个在线 COVID-19 搜索引擎,专门设计用于查找相关的蛋白质 - 化学配对,它采用面向关系的倒排索引,可检索和分组查询生物分子的研究,并由 BioNLP 管道自动创建倒排索引并集成在线用户界面。
- ICLR学习三维蛋白质结构的内在 - 外在卷积和池化
本文提出了两种新的学习操作 —— 卷积算子和分层汇聚算子,以实现对蛋白质数据的深度三维分析,并在共同蛋白质分析任务的几个大型数据集上评估了算法的准确性。
- NIPS多样化神经网络结构高质量预测蛋白质 Q8 二级结构
利用机器学习方法,通过构建神经网络模型和使用最新的建模方法对蛋白质二级结构的预测结果进行了研究和探讨,实验结果表明,模型精度达到 70.7%。通过完整地开放训练数据及代码,为领域内可重复性研究树立了良好标准。
- 蛋白质模型质量评估的深度迁移学习
该研究提出了一种基于深度神经网络的蛋白质模型质量预测方法,利用少量输入特征和粗略模型描述以及数据库中已知蛋白质结构的迁移学习,达到了最先进的性能表现。
- NIPS基于结构的虚拟筛选中相互作用预测的深度学习架构
介绍了一种基于深度学习的结构虚拟筛选算法,通过对每个化合物分别应用可学习原子卷积和 softmax 操作生成固定大小的蛋白质和小分子指纹。使用这些指纹进行内积计算来预测结合位点的亲和性,并且介绍了一种新的基准数据集 DUD-E 和 PDBB - 利用深度卷积神经场预测蛋白质的二级结构
DeepCNF 是蛋白质二级结构预测的深度学习框架,比当前流行的预测器更为准确,并可用于预测其他蛋白质结构属性,如接触数、无序区域和溶剂可及性。
- ICML深度监督卷积生成随机网络在蛋白质二级结构预测中的应用
利用一种基于深度分层表示的监督式生成随机网络模型来预测蛋白质的局部二级结构,该模型采用了卷积架构来使其规模化并提高学习效率,预测准确率可达 66.4%。
- 生物系统中模块化的出现
本文讨论了生物系统的模块化和等级结构,重点从蛋白质结构、基因、生物网络模块化分区的例子,并着重解释了生物学如何从化学多种可能性中自发地组织成结构化形式的理论。更重要的是,本文将模块化出现的过程描述为一种破缺对称的相变,以模块作为有序参数,并 - 罗塞塔无法解决的四个小谜题
通过测试 20 个氨基酸小蛋白的三维结构、小型缩二巯基 - 稳定的海螺毒素、丝氨酸蛋白酶抑制剂的反应环以及 UUCG RNA 四元环等四个建模案例,本文表明 Rosetta 分子建模套件在预测这类小分子方面表现不佳,结论是 Rosetta - 从接触图恢复蛋白质结构
该论文讨论了从接触图谱中恢复蛋白质三维结构的有效算法,可通过动力学以接触图谱的方式折叠蛋白质,同时研究了接触点数量减少时恢复结构质量的变化。