ChemEval：面向大型语言模型的全面多层次化学评估

Sep, 2024

ChemEval：面向大型语言模型的全面多层次化学评估

ChemEval: A Comprehensive Multi-Level Chemical Evaluation for Large Language Models

Yuqing Huang, Rongyang Zhang, Xuesong He, Xuyang Zhi, Hao Wang...

TL;DR本研究解决了现有大型语言模型（LLMs）评估在化学领域的不足，提出了ChemEval评估体系，以评估LLMs在多种化学任务中的能力。结果表明，一般LLMs在文献理解方面表现良好，但在需要高级化学知识的任务中存在不足，而专用LLMs则在化学能力上有所提升，这显示了优化LLMs以应对复杂化学任务的潜力。

Abstract

There is a growing interest in the role that LLMs play in Chemistry which lead to an increased focus on the development of LLMs benchmarks tailored to chemical domains to assess the performance of LLMs across a spectrum of chemical tasks varying in type and complexity. However, existin

发现论文，激发创造

GPT模型在化学方面能做什么？八项任务的综合评估

本文针对大语言模型在化学领域能力的未知，建立起一个包含8个化学实践任务的全面基准，运用GPT-4、GPT-3.5和Davinci-003三种GPT模型以零样本和少样本的情境下进行测试，发现GPT-4相较于其他两种模型表现更佳，而GPT模型在需要精确理解分子SMILES表示的任务中较为欠缺，而在文本相关的说明任务方面表现出较强的能力。

May, 2023

结构化化学推理与大型语言模型

本文研究利用大型语言模型（LLMs）解决复杂的化学问题的问题，提出了InstructChem，一种新的结构化推理方法，极大地提升了LLMs的化学推理能力。

Nov, 2023

ChemDFM：化学对话基础模型

化学研究中的大型语言模型，ChemDFM，具有高度专业化的语言和知识，并在化学任务中表现出强大的性能和效果。

Jan, 2024

从词语到分子: 化学中大型语言模型的调查

将大型语言模型 (LLMs) 整合到化学领域是一个复杂的任务，本文以细致的方法论探索了该跨学科领域的复杂性和创新，从分子信息如何通过各种表示和标记方法导入LLMs开始，将化学LLMs分为三个不同的群体，并讨论了将这些输入整合到LLMs的方法，然后探讨了应用LLMs在化学中的多样化应用，包括在化学任务中的新范例，最后确定了有望的研究方向，包括进一步整合化学知识，持续学习的进展以及模型可解释性的改进，为该领域的突破性发展铺平了道路。

Feb, 2024

化学LLM: 一种化学大型语言模型

ChemLLM是第一个专门用于化学领域的大型语言模型，通过使用结构化化学知识构建对话系统，能够在化学学科中顺畅交互完成各种任务，包括名称转换、分子标题和反应预测，并在相关数学和物理任务中展现出出色的适应性。

Feb, 2024

LlaSMol：通过大规模、综合、高质量的指导调整数据集推进化学领域的大型语言模型

我们研究了基于SMolInstruct数据集进行fine-tune的大型语言模型在化学任务上表现出色，特别是Mistral模型，同时，我们还分析了可训练参数的影响，为未来的研究提供了一些见解。

Feb, 2024

大型语言模型是超人级化学家吗？

通过ChemBench等评估框架，我们发现大型语言模型在化学科学中展示出卓越的能力，但仍需进一步研究以提高其安全性和实用性。

Apr, 2024

通过提示工程在大型语言模型中整合化学知识

本研究探讨了将领域特定知识整合到提示工程中，以增强科学领域的大型语言模型（LLMs）的性能。通过构建基准数据集，该方法在生物和化学领域中的复杂材料上得到验证，结果表明领域知识提示可以引导LLMs生成更准确和相关的回答，凸显LLMs在科学发现和创新中的潜力。

Apr, 2024

化学领域的大型语言模型和自主代理的综述

大规模语言模型（LLMs）在化学领域中以其准确预测性能、设计新分子、优化合成路径和加速药物和材料发现等能力成为一个强大的工具。本综述讨论了LLMs的历史、性能、设计以及在化学领域的挑战和未来方向，特别关注于代理人（agents）及其作为一个跨化学模式的出现。代理人在化学的各个领域中表现出了很好的效果，但依然存在挑战。开发面向特定领域的代理人和开发自主流程与“副驾驶”系统的对比对于加速化学进程尚不清楚。一种新兴的方向是开发使用人工智能辅助的多代理人系统。由于该领域的快速发展，已经建立了一个仓库，以追踪最新研究。

Jun, 2024

ChemVLM：探索多模态大语言模型在化学领域的应用

本研究解决了现有化学大语言模型在处理视觉信息方面的不足，提出了一种名为ChemVLM的多模态大语言模型，专门应用于化学领域。ChemVLM经过双语多模态数据集训练，能够更好地理解文本和视觉信息，实验结果表明其在多个评估任务中表现优异，对化学领域具有潜在的深远影响。

Aug, 2024