- 蛋白质结构生成的潜扩散模型
本研究提出了一种潜在的扩散模型,该模型可以在凝聚的潜在空间中灵活捕捉天然蛋白质结构的分布,从而通过等变蛋白自编码器生成高可设计性和高效率的新型蛋白质骨架结构。
- AAAI使用嵌套蒙特卡罗搜索解决 HP 模型
本文提出了一种新的 Monte Carlo Search 算法,用于寻找 HP-model 中蛋白质的基态能量,并将其与其他算法进行了简要比较,虽然并没有超过 PERM,REMC 或 WLRE 等算法的表现。
- 蛋白质表征学习综述:回顾与展望
该研究综述了蛋白质表征学习的发展及其模型架构、先验任务、下游应用等方面,介绍了序列、结构、序列 - 结构配合等三类现有方法,并探讨了蛋白质表征学习存在的技术挑战和发展方向。
- ICLR使用等变平移技术进行蛋白质序列和结构联合设计
本文提出了一种基于上下文特征的三角函数编码器和旋转平移等变解码器,能够在随机初始化的基础上迭代地将蛋白质序列和结构转化为所需状态,从而设计高保真度的蛋白质的新方法。实验结果表明,该方法在多项任务上均优于现有基线算法,而且比基于抽样的方法更快 - ICLR通过完整的三维图网络学习分层蛋白质表示
本文介绍 3D 图结构的蛋白质表示学习。使用蛋白质结构构建 3D 图,循序渐进地学习蛋白质的不同层级表示,并提出了一种新的层次图模型 ProNet,以便更好的分类和表征蛋白质。实验结果表明,ProNet 性能优于现有方法。
- 无分子的分子动力学:利用生成神经网络搜索蛋白质构象空间
利用人工智能和生成神经网络对蛋白质的分子动力学进行建模,将分子动力学的轨迹用 Ramachandran 盆类的向量表示,无需使用物理粒子,模型可以扩展无限,并能够完整地模拟蛋白质的构象空间。
- 使用等变去噪扩散概率模型生成蛋白质结构与序列
本文引入了一种生成模型,旨在设计具有特定 3D 结构和化学性质的蛋白质,以实现特定的功能。通过实验数据全面学习,该模型可生成全原子骨架构象以及序列和侧链预测,实现了分子生成建模方法的显著扩大。
- 蛋白质多尺度表征学习
本文提出了一种多尺度图构建方法 ——HoloProt,可以连接蛋白表面、结构和序列,并在不同任务上进行了测试,包括配基结合亲和力回归和蛋白质功能预测分类。该模型具有良好的稳定性和可靠性,并且在减少参数数量的情况下可以获得与现有模型相当的性能 - 应用自然语言处理方法探索化学空间,助力药物研发
自然语言处理在药物发现中的应用及影响
- NIPS蛋白质序列的变分自编码
使用变分自编码器对天然蛋白序列进行嵌入,以预测突变对蛋白质功能的影响,并可用于计算引导蛋白质序列空间的探索和更好地指导有理和自动蛋白质设计。
- 基于持久性加权高斯核的拓扑数据分析
本文提出一种基于 persistence diagrams 的核方法,用于发展统计学框架,该方法具有稳定性和快速逼近技术,并在蛋白质和氧化物玻璃的实际数据中证明了其比其他相关方法更具优势。
- ProtVec: 生物序列的连续分布式表示
介绍了一种新的生物序列表示和特征提取方法 BioVec,通过人工神经网络方法,将蛋白质序列表示为单个 n 维向量,可精确地识别蛋白质家族分类、蛋白质结构预测、无序蛋白质鉴定等各类生物信息学任务,表现优于现有方法。
- 蛋白质结构、柔性和折叠的持久同伴分析
本研究首次引入持久同调理论以及分子拓扑学概念,基于分子拓扑不变量持久性提出分子拓扑指纹(MTFs),并通过 MTFs 实现了对蛋白质的表征、识别和分类等任务,研究还建议了一种新型的截止距离过滤方法,并提出了基于持久同调不变量的累积条形图用于