扩散模型中的合成数据改善药物发现预测

May, 2024

扩散模型中的合成数据改善药物发现预测

Synthetic Data from Diffusion Models Improve Drug Discovery Prediction

Bing Hu, Ashish Saragadam, Anita Layton, Helen Chen

TL;DR人工智能在药物研发的各个阶段中得到了越来越多的应用。我们提出了一个新的数据挑战，即数据集常常相互独立收集，缺乏重叠部分，导致数据稀疏。为解决这一挑战，我们提出了一种新颖的扩散图神经网络模型 Syngand，可以全面生成配体和药物动力学数据。利用我们的 Syngand 模型，我们展示了一种用于现有配体采样药物动力学数据的方法学。我们在 AqSolDB、LD50 和 hERG central 等下游回归任务上展示了 Syngand 生成的合成靶标属性数据的初步有效结果。使用我们提出的模型和方法，研究人员可以轻松生成合成配体数据，以帮助他们探索涉及跨多个数据集的研究问题。

Abstract

artificial intelligence (AI) is increasingly used in every stage of drug development. Continuing breakthroughs in AI-based methods for drug discovery require the creation, improvement, and refinement of

artificial intelligence drug discovery data sparsity diffusion gnn model synthetic ligand data

发现论文，激发创造

为基于人工智能的疾病轨迹预测和药物开发数字孪生生成多维分子介质时间序列数据：考虑因素

本文讨论合成数据在神经网络人工智能系统开发中的重要作用，并探讨复杂多尺度机制模拟模型生成多维时间序列数据在生物医学领域中的应用，尤其是对于疾病预测和药物开发流程的重要性。

Mar, 2023

利用潜在扩散模型的合成数据增强医疗图像分类器

利用潜在扩散模型生成皮肤病图像的研究表明，通过合成数据训练模型可以在数据有限的情况下提高性能，但合成数据与真实数据相比仍然有较小的性能增益，因此收集多样的真实数据仍是提升医疗人工智能算法的重要步骤。

Aug, 2023

利用扩散模型提高数字 VLSI 电路的机器学习模型准确性：关于合成数据生成的研究

通过采用扩散模型在电路生成上进行人工数据生成的研究，用于提高在通常训练数据非常有限的情况下，机器学习模型在性能评估、设计和测试等任务中的准确性，本研究利用 HSPICE 设计环境中 22 纳米 CMOS 技术节点的仿真来获取真实代表性的训练数据，并证明了扩散模型生成的合成数据与真实数据的密切相似性，通过验证生成数据的质量，证明数据增强在数字电路的 VLSI 设计的预测分析中确实有效。

Oct, 2023

药物发现领域的人工智能：现在已经到达了吗？

药物发现正在适应新技术，如数据科学、信息学和人工智能（AI），以加速有效治疗的开发，同时减少成本和动物实验。 AI 正在改变药物发现的方式，成功的药物发现需要优化与药理动力学、药代动力学和临床结果相关的特性。本文讨论了 AI 在药物发现的三个支柱（疾病、靶点和治疗模式）中的应用，重点关注小分子药物。

Jul, 2023

药物相互作用预测中深度学习与图学习的综合评估

本文综述了基于化学结构、网络、自然语言处理、混合方法的药物预测模型以及基于图神经网络模型表示分子结构的理论框架或深度和图学习方法的优缺点、潜在技术难点和未来发展方向。

Jun, 2023

引导的多目标生成人工智能以增强基于结构的药物设计

通过结合深度扩散和多目标优化，IDOLpro 是一种新颖的生成化学人工智能，可以在计算机模拟中生成具有最优结合亲和力和合成易得性的配体，优化多种目标物理化学性质，并超越实验观察的配体的性能。

May, 2024

基于影像标注的潜在扩散模型用于增强组织病理学 AI 辅助癌症诊断

人工智能基于图像分析在诊断组织病理学方面，尤其是癌症诊断方面具有巨大潜力。为了开发监督式人工智能方法，需要大规模的注释数据集。本研究提出了一种从自动提取的图像特征中构建结构化文本提示的方法。通过在提示中引入图像特征而不仅仅是正常和癌症标签，我们改善了 Fréchet Inception Distance (FID) 的性能，从 178.8 提升到 90.2。我们还表明，病理学家难以检测到合成图像，敏感性 / 特异性的中位数为 0.55/0.55。最后，我们展示了合成数据有效地训练人工智能模型。

Dec, 2023

用于药物发现的深度图生成模型可视化

提出了一种可视化框架，用于可视化深度图形生成模型的编码和解码过程中生成的分子，并提供实时分子优化功能，这完善了黑盒子人工智能驱动的药物发现模型的可解释性。

Jul, 2020

两层扩散和多属性优化：一种生成具有理想特性分子的新方法

本文介绍了一种生成具有理想属性的分子的新方法，该方法通过在分子和分子片段上执行扩散来获取混合高斯分布，并使用新颖的基于电子效应的分解方法优化多个分子属性，从而在人工智能驱动的药物设计和发现方面具有重要的应用前景。

Oct, 2023

图扩散模型综述：分子、蛋白质和材料的科学生成式人工智能

本文调查了图扩散模型的进展，特别关注了其在 AI 生成内容方面的应用，主要是分子、蛋白质和材料设计。我们也讨论了评估该模型在图领域的存在挑战问题。

Apr, 2023