化学 LLM 是否能从信息传递中受益

KDDMay, 2024

化学 LLM 是否能从信息传递中受益

Could Chemical LLMs benefit from Message Passing

Jiaqing Xie, Ziheng Chi

TL;DR预训练语言模型和信息传递神经网络在处理分子文本和分子科学领域展示了显著的能力。本文提出了两种策略来评估信息整合是否能增强性能：对比学习和融合，经实证分析表明，当应用于较小的分子图时，整合方法相比基准模型表现出优越性能，而当应用于大规模图时，这些整合方法并未带来性能改进。

Abstract

pretrained language models (LMs) showcase significant capabilities in processing molecular text, while concurrently, message passing neural networks (MPNNs) demonstrate resilience and versatility in the domain of

pretrained language models message passing neural networks molecular text processing information integration performance enhancements

发现论文，激发创造

从词语到分子：化学中大型语言模型的调查

将大型语言模型 (LLMs) 整合到化学领域是一个复杂的任务，本文以细致的方法论探索了该跨学科领域的复杂性和创新，从分子信息如何通过各种表示和标记方法导入 LLMs 开始，将化学 LLMs 分为三个不同的群体，并讨论了将这些输入整合到 LLMs 的方法，然后探讨了应用 LLMs 在化学中的多样化应用，包括在化学任务中的新范例，最后确定了有望的研究方向，包括进一步整合化学知识，持续学习的进展以及模型可解释性的改进，为该领域的突破性发展铺平了道路。

Feb, 2024

量子化学中的神经消息传递

本文介绍了一种基于神经网络模型的消息传递神经网络 (Message Passing Neural Networks, MPNN)，并探索了 MPNNs 的衍生变体。在化学性质预测基准测试中，使用 MPNNs 获得了最先进的结果，表明将来的研究应该集中在具有更大分子或更精确地基础事实标签的数据集上。

Apr, 2017

LLM 与 GNN 互补：用于多模态图学习的 LLM 蒸馏

利用 GALLON 框架，将 LLMs 与 GNNs 能力结合起来，通过提取多模态知识到一个统一的多层感知器模型（MLP），集成了分子的丰富文本和视觉数据与 GNNs 的结构分析能力，显著提高了分子性质预测的准确性和效率。

Jun, 2024

全力以赴：在图神经网络中高效集成大规模语言模型的消息传递

我们提出了 E-LLaGNN（Efficient LLMs augmented GNNs）框架，通过使用 LLMs 来增强图学习的消息传递过程，从而提高了深度 GNNs 的梯度流和无 LLMs 的推理能力。

Jul, 2024

大规模语言模型用于分子预测任务的基准测试

LLMs 在分子预测任务中的表现相对较弱，而与机器学习模型合作使用时，LLMs 有潜力提升模型性能。

Mar, 2024

大型语言模型是超人级化学家吗？

通过 ChemBench 等评估框架，我们发现大型语言模型在化学科学中展示出卓越的能力，但仍需进一步研究以提高其安全性和实用性。

Apr, 2024

ALMol：通过离线偏好对比优化实现对齐的语言 - 分子翻译 LLM

化学和人工智能的交叉领域是一个积极研究的领域，旨在加速科学发现；该研究聚焦于机器翻译化学语言和分子模型，并采用一种新的训练方法，通过对比优化来提高模型性能。

May, 2024

巨型语言模型能够提升分子属性预测吗？

使用 Large Language Models (LLMs) 进行零 / 少量数据量的分子分类以及利用由 LLMs 生成的文本解释作为分子表示，可以大大提高分子属性预测的精度。

Jul, 2023

LLM 是否能够有效利用结构信息进行图学习：何时以及为什么

该研究探讨了大型语言模型（LLMs）在结构化数据（尤其是图形）上的应用，旨在理解何时以及为何将图形数据中固有的结构信息纳入到 LLMs 的节点分类任务中可以提高预测性能。

Sep, 2023

反馈对齐的混合 LLMs 用于机器语言分子翻译

使用先进的优化算法和非线性融合，通过少量数据实现科学大语言模型的性能提升和新的最佳水平，并引入细粒度的评估方法来评估大语言模型中的虚构能力和促进负责任的使用。

May, 2024