使用深度生成模型生成和设计 DNA
文章提出了一种结合遗传算法和深度学习的癌症灵感的基因组绘图模型 (CGMM),用于生成合成基因组以进行研究验证,并证明其在两项不同任务中优于当前四种最先进的基因组生成器,适用于基因组医学的诊断和治疗。
May, 2023
通过深度生成模型,特别是深度扩散模型,来合成 DNA 序列在合成生物学领域开辟了新的前景。我们提出了一种新颖的潜在扩散模型 (DiscDiff),通过将离散 DNA 序列嵌入连续的潜在空间,使用自编码器来利用连续扩散模型强大的生成能力生成离散数据。此外,我们引入了一种新的度量标准 Frechet Reconstruction Distance (FReD),用于衡量 DNA 序列生成结果的样本质量。我们的 DiscDiff 模型能够生成与真实 DNA 序列在 Motif 分布、潜在嵌入分布 (FReD) 和染色质剖面方面紧密相符的合成 DNA 序列。此外,我们还贡献了一个包含 15 个物种的 15 万个唯一启动子 - 基因序列的全面跨物种数据集,为未来基因组学中的生成建模工作提供丰富的资源。我们将在发表后公开我们的代码。
Oct, 2023
应用生成对抗网络(GAN)生成编码变长蛋白质的合成 DNA 序列,并提出了一种名为 Feedback GAN(FBGAN)的新型反馈回路体系结构来优化合成基因序列。通过基因序列针对所需性质的外部函数分析器进行优化,并用于生成抗菌肽编码的合成基因和优化编码的合成基因的辅助结构的示例。
Apr, 2018
通过综述最新的生成式人工智能在可控蛋白序列设计方面的进展,本文提出了蛋白质工程、生成式人工智能、蛋白序列设计、优化算法和研究机会等关键词,以及未解决的挑战。
Feb, 2024
本文介绍了一种基于序列的生成模型来设计分子的方法,通过增强情节似然性可以学习生成具有某些指定的理想特性的结构。将模型应用于生成类似物质结构,生成与药物 Celecoxib 类似的分子以及具有活性的化合物。最后,将模型调整为生成预测对多巴胺受体 2 具有活性的化合物,得到了 95% 以上的预测为活性的结构,其中包括实验证实的活性化合物。
Apr, 2017
提出了一种基于深度学习的模型 DeepSequence,可以预测基因突变对分子属性的影响,具有非线性的高阶约束,是一种能够应用于有关蛋白质和 RNA 相互作用的普适模型。
Dec, 2017
文献的主要内容是深度生成建模技术被应用于分子生成和优化,包括使用递归神经网络、自动编码器、生成对抗网络和强化学习等四种技术,并探讨了这些技术的数学基础和优缺点,内容涉及到分子表示和设计中的多个方面。
Mar, 2019
本文提出了一种半监督变分自编码器模型,能够同时进行属性预测和分子生成,从而高效生成具有所需属性的新分子。我们从估计好的生成分布中进行采样以生成新的分子,并在药物样分子上证明了该模型的有效性、改进了属性预测的性能,并高效生成满足各种目标条件的新型分子。
Apr, 2018