星际闲聊:使用大型语言模型与天文文献交流
该研究探讨了在天文学中应用大型语言模型(LLMs),尤其是 GPT-4,通过上下文提示,将模型提供给多达 1000 篇来自 NASA 天体物理学数据系统的论文,探索通过将模型浸入特定域的文献中可能提高性能的程度。我们的发现表明,在使用上下文提示时,假设生成可以得到实质性的提升,并且通过对抗性提示进一步强调了这一优势。我们展示了对抗性提示如何使 GPT-4 从庞大的知识库中提取关键细节以产生有意义的假设,这标志着将 LLMs 用于天文学科学研究的创新步骤。
Jun, 2023
通过对 ChatGPT 用于学术写作时所使用的词进行提取,以及在 100 万篇天文学文章中搜索这些词,研究评估了这些模型在天文学论文写作中的广泛应用,并提出建议,鼓励组织、出版商和研究人员共同制定伦理和实用指南,以最大程度地发挥这些系统的优势并保持科学严谨。
Jun, 2024
利用紧凑的 7B 参数的 LLaMA-2 模型来提升天文学问题回答的性能,通过有针对性、持续的预训练,在天文学语料库的精心筛选子集中取得了显著的专业主题理解提升,结果表明有限的资源下的持续预训练仍然可以提高模型在专业主题上的性能,该模型已经作为首个针对天文学社区的开源对话式人工智能工具发布,名称为 AstroLLaMA-Chat。
Jan, 2024
本文对 ChatGPT 和 GPT-4 进行了综合调查,分析了其在各领域的潜在应用,发现 ChatGPT/GPT-4 主要应用于自然语言处理,并在教育、历史、数学、医学和物理等领域具有潜力。同时也提出了伦理问题和未来发展方向。
Apr, 2023
近年来,在自然语言处理方面取得突破性进展的大型语言模型(LLM)的出现,展示了其在包括理解、生成和翻译自然语言甚至超越语言处理的任务方面的卓越能力。本文报告中,我们深入研究了 LLM 在科学发现环境中的性能,重点关注 GPT-4,这一最先进的语言模型。我们的调查涉及药物发现、生物学、计算化学(密度泛函理论(DFT)和分子动力学(MD))、材料设计和偏微分方程(PDE)等多个科学领域。评估 GPT-4 在科学任务上的表现对于揭示其在各个研究领域中的潜力、验证其特定领域的专长、加速科学进展、优化资源分配、指导未来模型发展以及促进跨学科研究至关重要。我们的探索方法主要包括专家驱动的案例评估,提供对模型理解复杂科学概念和关系的定性洞见,以及偶尔的基准测试,定量评估模型解决明确定义的特定领域问题的能力。我们的初步探索表明,GPT-4 在各种科学应用中展示出有希望的潜力,显示出处理复杂问题解决和知识整合任务的能力。总体而言,我们评估了 GPT-4 的知识库、科学理解、科学数值计算能力以及各种科学预测能力。
Nov, 2023
本技术报告针对大型语言模型 (ChatGPT 和 GPT-4),探究它们在玩文字游戏方面的能力,实验证明 ChatGPT 表现与现有系统相比具有竞争力,但仍没有足够的智能去构建游戏世界模型、利用已有世界知识和推断游戏进程中的目标。这为人工智能、机器学习和自然语言处理交叉领域开辟了新的研究问题。
Apr, 2023
通过使用大型语言模型 (LLMs) 和知识图谱聚类来提取天文文本中的实体和关系,本研究在黑客马拉松期间进行了一项实验,并演示了一种消歧实体的方法,该实体可在天文领域的各种上下文中出现。通过收集特定实体周围的摘录并利用 GPT-4 语言模型,提取相关实体和关系。然后使用利登算法对这些提取的信息构建知识图谱,并对图谱进行聚类。利登聚类结果被用来识别未知摘录与每个聚类的关联度百分比,从而实现消歧。实验展示了在天文研究中将 LLMs 和知识图谱聚类技术相结合进行信息提取的潜力,结果强调了该方法在识别和消歧实体以及基于关系对它们进行有意义聚类方面的有效性。
Jun, 2024
通过对天文数据进行微调,GPT 模型证明了其在分类天体物理现象、区分 GRB 类型、估算类星体的红移以及黑洞参数估算方面的能力,标志着大型语言模型在科学研究中的有效性。同时,文章还提出了一种基于数据理解和基础模块建设的方法,为培养和控制比人类更聪明的 AI 提供了思路。
Apr, 2024
本文讨论 OpenAIs ChatGPT,一种用于文本型用户请求(即聊天机器人)的生成式预训练转换器。讨论了 ChatGPT 及类似模型背后的历史和原则,以及其对学术界和学术研究出版的潜在影响。ChatGPT 被认为是自动准备论文和其他类型学术手稿的潜在模型。此外,还讨论了可能出现的潜在伦理问题,并将其置于人工智能、机器学习和自然语言处理的更广泛进展的背景之下。
Mar, 2023
该论文探讨了将大型语言模型(如生成式预训练变换器 GPT)整合到人机合作环境中,通过口头人机交流手段促进可变自主性的快速发展的数字景观中,介绍了一种基于 Unity 虚拟现实(VR)环境的 GPT 驱动多机器人测试平台的创新框架。用户研究表明,用户对于与机器人对话的预设期望较高,却很少尝试探索机器人合作伙伴的实际语言和认知能力,但那些进行探索的用户能从更自然的沟通和人类式的双向交流中受益。我们提供了一组对未来研究和类似系统的技术实施的经验教训。
Dec, 2023