AAAIFeb, 2024

基于扩散语言模型的文本引导分子生成

TL;DR本文介绍了一种基于扩散语言模型的文本导向分子生成方法 (TGM-DLM),该方法在生成具有特定文本描述的分子时克服了自回归方法的局限性,并通过两阶段的扩散生成过程共同和迭代地更新 SMILES 字符串中的标记嵌入。实验证明,TGM-DLM 模型在生成具有特定属性的连贯且准确的分子方面优于自回归模型 MolT5-Base,无需额外的数据资源,为药物发现和相关科学领域开辟了新的途径。