ChemDFM：化学对话基础模型

Jan, 2024

ChemDFM: Dialogue Foundation Model for Chemistry

Zihan Zhao, Da Ma, Lu Chen, Liangtai Sun, Zihao Li...

TL;DR化学研究中的大型语言模型，ChemDFM，具有高度专业化的语言和知识，并在化学任务中表现出强大的性能和效果。

Abstract

large language models (LLMs) have established great success in the general domain of natural language processing. Their emerging task generalization and free-form dialogue capabilities can greatly help to design Chemical General Intelligence (CGI) to assist real-world research in chemi

large language models chemical general intelligence chemdfm smiles notation chemistry research

发现论文，激发创造

化学 LLM: 一种化学大型语言模型

ChemLLM 是第一个专门用于化学领域的大型语言模型，通过使用结构化化学知识构建对话系统，能够在化学学科中顺畅交互完成各种任务，包括名称转换、分子标题和反应预测，并在相关数学和物理任务中展现出出色的适应性。

Feb, 2024

大型语言模型是超人级化学家吗？

通过 ChemBench 等评估框架，我们发现大型语言模型在化学科学中展示出卓越的能力，但仍需进一步研究以提高其安全性和实用性。

Apr, 2024

从词语到分子：化学中大型语言模型的调查

将大型语言模型 (LLMs) 整合到化学领域是一个复杂的任务，本文以细致的方法论探索了该跨学科领域的复杂性和创新，从分子信息如何通过各种表示和标记方法导入 LLMs 开始，将化学 LLMs 分为三个不同的群体，并讨论了将这些输入整合到 LLMs 的方法，然后探讨了应用 LLMs 在化学中的多样化应用，包括在化学任务中的新范例，最后确定了有望的研究方向，包括进一步整合化学知识，持续学习的进展以及模型可解释性的改进，为该领域的突破性发展铺平了道路。

Feb, 2024

基于 LLMs 的药物分子结构的碎片水平理解的实证证据

AI 用于药物发现是近年来的研究热点，基于 SMILES 的语言模型越来越多地应用于药物分子设计。本研究探讨了语言模型是否以及如何从 1D 序列中理解化学空间结构。我们在化学语言上对 Transformer 模型进行预训练，并朝向药物设计目标进行微调，研究高频 SMILES 子字符串与分子片段的对应关系。结果表明，语言模型可以从分子片段的角度理解化学结构，并且通过微调学到的结构知识反映在模型生成的高频 SMILES 子字符串中。

Jan, 2024

化学文献数据挖掘自主大模型代理

通过大型语言模型技术，我们提出了一种全面的人工智能代理框架，能够高度准确地从大量化学文献中提取信息，实现化学文献的自动化处理，从而节省人力资源并提升性能。这一方法在化学文献处理方面具有重要的实践价值，并展示了人工智能在化学数据管理和利用方面的潜力。

Feb, 2024

结构化化学推理与大型语言模型

本文研究利用大型语言模型（LLMs）解决复杂的化学问题的问题，提出了 InstructChem，一种新的结构化推理方法，极大地提升了 LLMs 的化学推理能力。

Nov, 2023

化学领域的大型语言模型和自主代理的综述

大规模语言模型（LLMs）在化学领域中以其准确预测性能、设计新分子、优化合成路径和加速药物和材料发现等能力成为一个强大的工具。本综述讨论了 LLMs 的历史、性能、设计以及在化学领域的挑战和未来方向，特别关注于代理人（agents）及其作为一个跨化学模式的出现。代理人在化学的各个领域中表现出了很好的效果，但依然存在挑战。开发面向特定领域的代理人和开发自主流程与 “副驾驶” 系统的对比对于加速化学进程尚不清楚。一种新兴的方向是开发使用人工智能辅助的多代理人系统。由于该领域的快速发展，已经建立了一个仓库，以追踪最新研究。

Jun, 2024

DFM: 用于大规模对话导向任务学习的对话基础模型

本文旨在构建一种统一的会话基础模型，通过收集大规模多样化的对话数据集和引入自监督任务，提高该模型的稳定性。实验结果表明，与其他相同规模的模型相比，该模型在跨领域对话任务方面有着领先的表现。

May, 2022

科学语言建模：大型语言模型在分子科学中的定量评价

通过使用多模态基准 ChEBI-20-MM，我们评估了模型与数据模态的兼容性和知识获取，并通过模态转移概率矩阵提供了适用于任务的最合适的模态，同时引入了一种统计可解释的方法，通过局部特征过滤来发现具有上下文特定的知识映射，从而揭示了科学语言建模在分子科学中的学习机制及其推进方法的可能性。

Feb, 2024

基于扩散语言模型的文本引导分子生成

本文介绍了一种基于扩散语言模型的文本导向分子生成方法 (TGM-DLM)，该方法在生成具有特定文本描述的分子时克服了自回归方法的局限性，并通过两阶段的扩散生成过程共同和迭代地更新 SMILES 字符串中的标记嵌入。实验证明，TGM-DLM 模型在生成具有特定属性的连贯且准确的分子方面优于自回归模型 MolT5-Base，无需额外的数据资源，为药物发现和相关科学领域开辟了新的途径。

Feb, 2024