- MoleculeCLA: 通过计算化学配体 - 靶标结合分析重新思考分子基准
构建精确大规模的分子表示数据集,通过深度学习模型为药物发现的人工智能领域提供准确可靠的基准。
- 基于多模态多任务预训练的预测聚合物性质
该研究提出了 MMPolymer,一种新颖的多模态多任务预训练框架,结合了聚合物的 1D 顺序信息和 3D 结构信息,以增强下游聚合物性质预测任务。实验证明,MMPolymer 在各种聚合物性质预测任务中实现了最先进的性能。
- 将分子表示为可解释文法上的随机游走
分子发现中的数据有效和可解释的模型在材料设计中的应用取得了明显的优势和合成能力。
- ADA-GNN:基于原子距离和角度的晶体材料性能预测的图神经网络
基于双尺度邻域划分机制的晶体结构建模和基于原子 - 距离 - 角度图神经网络(ADA-GNN)的属性预测任务处理方法,通过分别处理节点信息和结构信息,提高了预测准确性和推理时间。在两个大规模材料基准数据集上,我们的方法取得了最先进的属性预测 - 基于结构的材料属性预测方法对比研究
现实世界材料研究中,机器学习模型通常被期望能够预测和发现与已知材料不同的新颖材料。本研究在物性预测模型性能评估中提供了客观评价,在超出训练集分布的材料中预测模型的性能。通过在三个基准数据集上对基于结构的图神经网络的广泛实验,我们发现当前最先 - 从分子到材料:为原子性质预测训练大规模通用模型
多领域预训练为化学领域的属性预测带来了新的突破,特别是对于低数据任务,利用多样化的数据进行预训练可以提高性能和泛化能力。
- 基于片段的分子图预训练与微调
利用基于片段的对比学习方法,在分子图预测性质方面取得了良好表现并提高了长程生物标准的预测效果。
- MHG-GNN:分子超图语法与图神经网络的组合
材料发现中,性质预测起着重要作用。我们引入了一种称为 MHG-GNN 的新型自编码器,它将图神经网络(GNN)与分子超图文法(MHG)相结合。各种不同材料的性质预测任务结果表明 MHG-GNN 具有很大的潜力。
- 分子发现中的语言模型
科学语言模型在分子发现中的作用及其在药物设计、性质预测和反应化学中的优势,以及通过降低科学语言建模领域的门槛来加速化学发现,并提出结合聊天机器人界面和计算化学工具的分子设计愿景。
- IJCAI基于图采样的分子属性预测元学习
为了有效利用分子和性质之间的多对多关系,我们提出了一种基于图采样的元学习(GS-Meta)框架来解决少样本分子属性预测问题。在五个常用基准测试中,GS-Meta 方法在 ROC-AUC 上始终优于现有技术 5.71%-6.93%,并验证了每 - 原子和子图感知的双向聚合用于分子表示学习
本文通过引入 Atomic and Subgraph-aware Bilateral Aggregation 模型,综合考虑原子和子图两种信息,提高分子性质预测的表示学习,该方法在药物和材料发现等领域具有广泛的应用。
- 一种全面而多功能的多模态深度学习方法,用于预测先进材料的多种性质
通过融合物理属性和化学数据,我们提出了一个多模态深度学习框架,用于预测一种 10 维丙烯酸聚合物复合材料的物理特性。该框架可以处理 18 维的复杂性,成功预测了 114,210 种成分条件下的 913,680 个物性数据点。我们提出了一个分 - polyBERT:一种化学语言模型实现全机器驱动的超快速高分子信息学
一种快速高效的机器学习驱动的聚合物信息学管道,使用一种名为 polyBERT 的化学指纹能力来识别聚合物的化学结构,并将其映射到一系列物性。该管道通过 2 个数量级的速度优势远超过手工指纹方案,同时保持准确性,是部署在可扩展架构中的强有力选 - ICLR回归 Transformer: 分子语言建模的序列回归和生成并行
本文提出 Regression Transformer(RT)方法,它是一种基于序列模型的回归模型,可用于小分子、蛋白质和化学反应的属性预测任务及其生成。该方法通过新颖的交替训练方案,使其在化学或蛋白质空间的属性驱动、局部探索中具有特殊的应 - Rxn Hypergraph: 化学反应表示的超图注意力模型
采用基于图的分子结构表示的超图注意力神经网络方法解决化学反应表示与性质预测问题,既能增强在通用性、鲁棒性、解释性等方面的考虑,又能达到比其他方法更好的性能与可解释性。
- 双视角分子预训练
该研究提出了一种双视图分子预训练算法(简称 DMP),旨在将分子的图表示和 SMILES 序列表示相结合进行预训练,经过在多种分子特性预测任务和合成规划任务上的测试,DMP 都取得了最先进的表现。
- 欧几里得神经网络直接预测声子态密度
本论文利用欧氏神经网络,输入仅为原子种类和位置,直接预测晶体固体中的声子态密度。通过该方法,可以高效地探索材料的声子结构,并能进一步快速筛选出高性能的热储存材料和声子介导超导体。
- GEOM:用能量注释的分子构象进行性质预测和分子生成
使用密度泛函理论和高级采样方法生成超过 450,000 种分子的 3D 构象,这将有助于从构象集合中预测分子性质并进行生成模型的开发。
- 以图形网络为分子和晶体的通用机器学习框架
研究者们提出了一种新的机器学习方法 Graph Networks,开发了通用的 MEGNet 模型,成功地预测了分子和晶体的物性,并提出了两个解决材料科学和化学数据局限性的新策略。