大型语言模型是超人级化学家吗?
本文针对大语言模型在化学领域能力的未知,建立起一个包含8个化学实践任务的全面基准,运用GPT-4、GPT-3.5和Davinci-003三种GPT模型以零样本和少样本的情境下进行测试,发现GPT-4相较于其他两种模型表现更佳,而GPT模型在需要精确理解分子SMILES表示的任务中较为欠缺,而在文本相关的说明任务方面表现出较强的能力。
May, 2023
本文研究利用大型语言模型(LLMs)解决复杂的化学问题的问题,提出了InstructChem,一种新的结构化推理方法,极大地提升了LLMs的化学推理能力。
Nov, 2023
将大型语言模型 (LLMs) 整合到化学领域是一个复杂的任务,本文以细致的方法论探索了该跨学科领域的复杂性和创新,从分子信息如何通过各种表示和标记方法导入LLMs开始,将化学LLMs分为三个不同的群体,并讨论了将这些输入整合到LLMs的方法,然后探讨了应用LLMs在化学中的多样化应用,包括在化学任务中的新范例,最后确定了有望的研究方向,包括进一步整合化学知识,持续学习的进展以及模型可解释性的改进,为该领域的突破性发展铺平了道路。
Feb, 2024
ChemLLM是第一个专门用于化学领域的大型语言模型,通过使用结构化化学知识构建对话系统,能够在化学学科中顺畅交互完成各种任务,包括名称转换、分子标题和反应预测,并在相关数学和物理任务中展现出出色的适应性。
Feb, 2024
我们研究了基于SMolInstruct数据集进行fine-tune的大型语言模型在化学任务上表现出色,特别是Mistral模型,同时,我们还分析了可训练参数的影响,为未来的研究提供了一些见解。
Feb, 2024
大规模语言模型(LLMs)在化学领域中以其准确预测性能、设计新分子、优化合成路径和加速药物和材料发现等能力成为一个强大的工具。本综述讨论了LLMs的历史、性能、设计以及在化学领域的挑战和未来方向,特别关注于代理人(agents)及其作为一个跨化学模式的出现。代理人在化学的各个领域中表现出了很好的效果,但依然存在挑战。开发面向特定领域的代理人和开发自主流程与“副驾驶”系统的对比对于加速化学进程尚不清楚。一种新兴的方向是开发使用人工智能辅助的多代理人系统。由于该领域的快速发展,已经建立了一个仓库,以追踪最新研究。
Jun, 2024
本研究解决了现有化学大语言模型在处理视觉信息方面的不足,提出了一种名为ChemVLM的多模态大语言模型,专门应用于化学领域。ChemVLM经过双语多模态数据集训练,能够更好地理解文本和视觉信息,实验结果表明其在多个评估任务中表现优异,对化学领域具有潜在的深远影响。
Aug, 2024
本研究解决了大型语言模型在化学空间探索中的应用问题,提出了一种新的方法,通过对开源Llama模型进行有监督微调和直接偏好优化,开发出一种化学语言模型。最重要的发现是,该模型能够生成符合药物开发需求的分子,具有广泛的应用潜力。
Sep, 2024
本研究解决了现有大型语言模型(LLMs)评估在化学领域的不足,提出了ChemEval评估体系,以评估LLMs在多种化学任务中的能力。结果表明,一般LLMs在文献理解方面表现良好,但在需要高级化学知识的任务中存在不足,而专用LLMs则在化学能力上有所提升,这显示了优化LLMs以应对复杂化学任务的潜力。
Sep, 2024