用于科学综合、推理和解释的大型语言模型

Oct, 2023

用于科学综合、推理和解释的大型语言模型

Large Language Models for Scientific Synthesis, Inference and Explanation

Yizhen Zheng, Huan Yee Koh, Jiaxin Ju, Anh T. N. Nguyen, Lauren T. May...

TL;DR使用大型语言模型进行科学综合、推理和解释，通过从科学文献综合知识，将其应用于预测分子属性等任务，提高了当前机器学习系统的性能，并能解释其预测结果，将加速科学发现的进程。

Abstract

large language models are a form of artificial intelligence systems whose primary knowledge consists of the statistical patterns, semantic relationships, and syntactical structures of language1. Despite their limited forms of "knowledge", these systems are adept at numerous complex tas

发现论文，激发创造

大型语言模型的紧急自主科研能力

本论文展示了一个结合多个大型语言模型的智能代理系统，可自主设计、规划和执行科学实验，并通过三个不同的实例展示代理的科学研究能力，最为复杂的是成功执行加催化交叉偶联反应。最后，讨论了这种系统的安全影响，并提出了防止滥用的措施。

Apr, 2023

大型语言模型用于科学研究的跨学科视角

大型语言模型 (LLMs) 能够在不同学科领域发挥作用和限制，加强科学研究，例如通过总结大量出版物加速文献回顾，通过自动语法纠正提升代码开发，和优化科学写作过程。然而，LLMs 面临挑战，如依赖庞大且有时偏颇的数据集，以及出于使用而引发的潜在伦理困境。我们对LLMs在不同领域的影响进行重要讨论，从自然科学中帮助模拟复杂生物序列，到社会科学中解析大规模的定性数据。最后，我们提供一种细致的观点，认为LLMs既是科学进步的福音，也是其边界。

Nov, 2023

大型语言模型的零样本假设提出者

大型语言模型 (LLMs) 可以作为催化剂引发新的科学发现，并指导进一步的探索。

Nov, 2023

大型语言模型对科学发现的影响：使用 GPT-4 的初步研究

近年来，在自然语言处理方面取得突破性进展的大型语言模型（LLM）的出现，展示了其在包括理解、生成和翻译自然语言甚至超越语言处理的任务方面的卓越能力。本文报告中，我们深入研究了LLM在科学发现环境中的性能，重点关注GPT-4，这一最先进的语言模型。我们的调查涉及药物发现、生物学、计算化学（密度泛函理论（DFT）和分子动力学（MD））、材料设计和偏微分方程（PDE）等多个科学领域。评估GPT-4在科学任务上的表现对于揭示其在各个研究领域中的潜力、验证其特定领域的专长、加速科学进展、优化资源分配、指导未来模型发展以及促进跨学科研究至关重要。我们的探索方法主要包括专家驱动的案例评估，提供对模型理解复杂科学概念和关系的定性洞见，以及偶尔的基准测试，定量评估模型解决明确定义的特定领域问题的能力。我们的初步探索表明，GPT-4在各种科学应用中展示出有希望的潜力，显示出处理复杂问题解决和知识整合任务的能力。总体而言，我们评估了GPT-4的知识库、科学理解、科学数值计算能力以及各种科学预测能力。

Nov, 2023

科学大型语言模型：生物与化学领域综述

大型语言模型 (LLMs) 在增强自然语言理解方面具有变革性的力量，代表着朝着人工通用智能迈出的重要一步。科学LLMs是一个新兴的领域，专门针对促进科学发现进行工程化设计。本文详细调查了科学LLMs，并围绕生物化学领域进行了深入研究，包括文本知识、小型分子、大分子蛋白质、基因组序列以及它们的组合，从模型架构、能力、数据集和评估等方面进行了分析。最后，我们批判性地审查了当前的挑战，并指出了前景广阔的研究方向以及LLMs的进展。通过提供对该领域技术发展的全面概述，本调查力求成为研究人员在科学LLMs复杂领域中的宝贵资源。

Jan, 2024

科学语言建模：大型语言模型在分子科学中的定量评价

通过使用多模态基准ChEBI-20-MM，我们评估了模型与数据模态的兼容性和知识获取，并通过模态转移概率矩阵提供了适用于任务的最合适的模态，同时引入了一种统计可解释的方法，通过局部特征过滤来发现具有上下文特定的知识映射，从而揭示了科学语言建模在分子科学中的学习机制及其推进方法的可能性。

Feb, 2024

大型语言模型的假设生成

大型语言模型利用数据分析生成假设，通过多臂赌博机设计奖励函数提高预测性能，并发现验证人类理论的新见解。

Apr, 2024

大型语言模型的科学计算

大型语言模型在科学计算应用中的应用领域和研究进行了概述，重点突出了涉及科学文献和描述物理系统的专用语言的自然语言处理的使用案例。在医学、数学和物理学领域，聊天机器人样式的应用可以与领域专家进行迭代，进行问题解决。同时，我们还对分子生物学中的专用语言进行了审查，这些语言包括分子、蛋白质和DNA的使用，语言模型被用于预测特性，甚至以比传统计算方法快得多的速度创建新型物理系统。

Jun, 2024

科学大型语言模型及其在科学发现中的应用综述

该研究对250个科学领域的大型语言模型进行了全面调研，揭示了它们在架构和预训练技术上的交叉领域和跨模态连接，并总结了每个领域和模态的预训练数据集和评估任务。此外，还研究了大型语言模型在科学发现中的应用。

Jun, 2024

面向科学文本的高效大型语言模型：综述

本研究解决了大型语言模型在科学领域应用时面临的高昂计算资源和训练时间的问题。通过对现有方法的总结与分析，本文提出了两条主要的研究方向，即模型规模和数据质量的提升。研究表明，这些方法的综合应用能够显著降低科学领域内使用大型语言模型的成本，推动更可负担的AI解决方案的发展。

Aug, 2024