蛋白质序列的变分自编码
利用变分自编码器生成所需属性的蛋白质序列,不需要人为干预,可添加潜在的铜和钙结合位点并与隐马尔可夫模型进行比较,同时开发了蛋白质结构语法用来产生一种新型蛋白质拓扑结构。该模型能够限制蛋白质序列的搜索空间,易于扩展,有助于各种蛋白质设计任务。
Jun, 2018
本文提出了一种新的预训练框架,它将用于蛋白质主体结构和三级结构的序列和几何分析器级联,模拟野生型蛋白质的自然选择并评估变体的效果,以指导遗传突变方向,实现所需特征,提出了一种新的变体影响预测方法,其预测结果在单点和深部变异方面表现良好。
Jun, 2023
提出了一种基于深度学习的模型 DeepSequence,可以预测基因突变对分子属性的影响,具有非线性的高阶约束,是一种能够应用于有关蛋白质和 RNA 相互作用的普适模型。
Dec, 2017
本文提出了一种基于上下文特征的三角函数编码器和旋转平移等变解码器,能够在随机初始化的基础上迭代地将蛋白质序列和结构转化为所需状态,从而设计高保真度的蛋白质的新方法。实验结果表明,该方法在多项任务上均优于现有基线算法,而且比基于抽样的方法更快且可靠。
Oct, 2022
本研究提出了一种潜在的扩散模型,该模型可以在凝聚的潜在空间中灵活捕捉天然蛋白质结构的分布,从而通过等变蛋白自编码器生成高可设计性和高效率的新型蛋白质骨架结构。
May, 2023
本文利用一种序列到序列自编码器模型以无监督的方式学习长度可变的 DNA 序列的固定维度的潜在表示,并在监督学习的拼接位点分类任务中进行了定量和定性评估。实验表明,此类表示法可用作通常相关的任务中的特征或先验,并且采用的模型归因技术获得的序列特征对分类精度有显著影响。
Jun, 2019
通过使用改良版图神经网络和序列为基础的方法进行比较,本文旨在填补预测最优蛋白变体的结构和基序方法之间的研究缺口,结果显示出使用这种新方法在训练更少的分子数量时实现了接近基序方法的竞争性性能,此外,将结构预训练模型与测定的标记数据相结合,可以产生与序列预训练模型类似的趋势。
Jun, 2023