- ICMLGeoMFormer:一种用于几何分子表示学习的通用架构
通过 GeoMFormer 这一基于 Transformer 的分子模型,在维持和学习不变和等变表示的同时,通过精心设计的交叉注意力模块实现信息融合和增强几何建模,以提高不同类型和规模的不变和等变任务的性能。
- 用图神经网络的粗粒化力场中的热力学可传递性
通过使用图卷积神经网络 (HIP-NN-TS) 构建粗粒化力场的高度自动化训练流程,我们展示了机器学习技术在改进可转移粗粒化力场构建方面的潜力。这种方法不仅能够产生高精度的力场,而且在多种热力学条件下具有更好的转移性。
- 利用隐性溶剂机器学习势预测溶剂自由能
通过参数化隐式溶剂机器学习模型来准确预测包括水合自由能在内的小有机分子相互作用,为药物设计和污染物建模提供一个比传统原子模型更准确且计算成本更低的方法。
- 科学语言建模:大型语言模型在分子科学中的定量评价
通过使用多模态基准 ChEBI-20-MM,我们评估了模型与数据模态的兼容性和知识获取,并通过模态转移概率矩阵提供了适用于任务的最合适的模态,同时引入了一种统计可解释的方法,通过局部特征过滤来发现具有上下文特定的知识映射,从而揭示了科学语言 - 量子蒙特卡洛梳理
分子建模在量子级别需要选择一个能够尊重所需粒子对称性并可扩展到多粒子系统的波函数参数化。本文通过引入一种基于排序的新的反对称化层(称为 sortlet),在注意力神经网络骨干上应用该反对称化层,得到了一种灵活的波函数参数化形式,能够在逼近一 - ACLMolXPT:将文本与分子结合进行生成预训练
本文提出了 MolXPT,一个基于 SMILES 的统一文本和分子预训练语言模型,将来自 PubMed 的文本序列和来自 PubChem 的 SMILES 序列一起进行预训练,并取得了超越强基线的性能。
- MUDiff:完整分子生成的统一扩散
本文提出一种新的分子数据生成模型,它将离散与连续的扩散过程相结合。 通过扩散过程的使用,可以捕获分子过程的概率性质,并探索不同因素对分子结构和性质的影响。 此外,文中还提出了一种新颖的图形变换器架构,用于去噪扩散过程,可以用于学习鲁棒的分子 - InstructBio:用于生化问题的大规模半监督学习范式
本文提出了一种半监督学习算法 InstructMol 来解决大规模的分子建模任务中数据稀缺的问题,并在细粒度后处理以提高准确性。
- DiffBP: 用于靶向蛋白结合的三维分子生成扩散
利用基于蛋白质为环境约束的扩散模型,在非自回归的完整原子水平上,去噪元素类型和整个分子的三维坐标,学习生成过程,相较其他方法具有更高的相似性和更适当的分子大小以及其他药物性质。
- 基于人工智能的有机化学高超图网络:网络统计和反应分类应用
本文提出了一种基于超图的化学反应网络表示方法,旨在研究反应的统计特性和利用超图嵌入解决反应分类问题。结果表明,超图表示方法具有灵活性、能够保留反应上下文,且能够揭示出传统有向图表示方法无法呈现的隐含特征。
- 分子表示的几何深度学习
该综述介绍了基于对称信息的神经网络的几何深度学习在分子建模领域的应用,强调了所学到的分子特征和他们与传统分子描述符相互补充的重要性,并给出了该领域未来的发展前景。
- 结合机器学习与计算化学以预测化学系统的观察结果
新颖的应用机器学习与计算化学方法在分子建模、材料建模、药物设计等方面取得了可靠且富有洞见的预测结果。