- 面向科学的可扩展人工智能:视角、方法和实例
文章探讨了在一个后 ChatGPT 的世界中,利用可扩展的人工智能进行科学发现的潜力,并提出了将人工智能在高性能计算平台上扩展起来以解决复杂问题的重要性。该研究侧重于认知模拟、用于科学探究的大型语言模型、医学图像分析和物理注入方法等科学应用 - 科学大型语言模型及其在科学发现中的应用综述
该研究对 250 个科学领域的大型语言模型进行了全面调研,揭示了它们在架构和预训练技术上的交叉领域和跨模态连接,并总结了每个领域和模态的预训练数据集和评估任务。此外,还研究了大型语言模型在科学发现中的应用。
- 科学目的解释黑盒子:在生成人工智能时代重新审视科学方法
在人工智能时代,人类复杂推理对于科学发现仍然至关重要,但可以通过可解释的人工智能利用人工智能系统来进行科学发现。具体而言,了解人工智能系统用于做出决策的数据可以与领域专家和科学家进行接触,并在给定的科学问题上产生不同或相同的观点。这些观点可 - 晶体结构的生成逆设计:基于转换器的扩散模型
通过训练生成模型来加快科学发现并推动各个科学领域的重大进展,尤其是发现具备良好性能的新型无机材料是一项关键挑战,不同于文本或图像数据,材料,特别是晶体结构,由多种类型的变量组成,包括晶格矢量、原子位置和原子种类,本研究探索一种基于 Tran - 利用语言模型进行元设计量子实验
人工智能的代码生成语言模型在量子物理实验领域发现了新的设计规则,为机器辅助科学理解提供了重要的工具。
- 超越模式匹配学习?对 LLM 中的数学理解进行评估
通过评估预训练语言模型对解决问题所需的不同数学技能的领域知识,本文提出了 NTKEval 方法来评估 LLM 概率分布变化的培训,发现当场景中学到的培训以及利用数学知识结构时存在领域理解。相比之下,某些指令调整导致类似的性能变化,无论培训数 - 反馈对齐的混合 LLMs 用于机器语言分子翻译
使用先进的优化算法和非线性融合,通过少量数据实现科学大语言模型的性能提升和新的最佳水平,并引入细粒度的评估方法来评估大语言模型中的虚构能力和促进负责任的使用。
- ICMLLLM 和仿真作为双层优化器:推进物理科学发现的新范式
大语言模型近来在科学发现中引起了重要关注,它们拥有丰富的知识和先进的推理能力。本研究提出了一种新方法,通过结合模拟和语言来增强 LLMs 的抽象推理能力,并在构成定律探索和分子设计中展现了不同于传统科学预期的新颖解决方案。
- 机器学习在科学发现中的机遇
科学界利用机器学习技术进行科学探索的能力正在初生阶段,然而,机器学习的原理应用正在为基础科学发现开辟新的途径,尤其在处理观测数据的复杂性方面。
- 基于自治型 LLM 的从数据到可人工验证的研究论文
AI 驱动的科学研究中的透明度、可追溯性和可核实性对加速科学发现具有潜力。
- CVPR透过几何约束概率建模发现新颖的生物医学概念
将几何受限的概率建模方法应用于机器学习以解决生物医学领域中累积数据的挑战,从而实现科学发现中的新类别探索。
- 基于基因表达数据的科学发现的 AI 科学家团队
利用团队人工智能科学家的新框架,通过机器学习大语言模型协同工作以提高科学探索的效率和范围,实现自动化科学发现。这一框架以疾病预测基因鉴定为重点,并使用一个参考数据集评估其有效性。
- 科学大型语言模型:生物与化学领域综述
大型语言模型 (LLMs) 在增强自然语言理解方面具有变革性的力量,代表着朝着人工通用智能迈出的重要一步。科学 LLMs 是一个新兴的领域,专门针对促进科学发现进行工程化设计。本文详细调查了科学 LLMs,并围绕生物化学领域进行了深入研究, - 利用 GPT-4V 进行网孔化学中的图像和数据挖掘
该研究展示了 GPT-4V 的卓越能力,在金属有机框架方面的搜索和数据获取方面尤其出色。通过自动将 346 篇学术文章转化为 6240 张图像,并运用 GPT-4V 进行自然语言提示分析,该方法在判断和解释关键图表(如氮吸附等温线、PXRD - 用于科学发现的符号回归的 Transformer 模型
这篇研究论文介绍了一种新的 Transformer 模型,用于符号回归(Symbolic Regression)特别关注其在科学发现领域的应用。我们提出了三种不断增加灵活性的编码器架构,但代价是列置换等变性的破坏。训练结果表明,最灵活的架构 - 机器引导下探索现实世界的孤立波模型
通过因果分析、深度学习、遵循简约原则的模型选择和符号回归,本文通过一个案例研究展示了利用数据发现海洋罕见巨浪的新符号模型。该模型基于大量浮标观测数据上训练的人工神经网络,同时兼顾预测性能和因果不变性。我们将这个黑盒模型应用于符号回归,转化为 - 大型语言模型对科学发现的影响:使用 GPT-4 的初步研究
近年来,在自然语言处理方面取得突破性进展的大型语言模型(LLM)的出现,展示了其在包括理解、生成和翻译自然语言甚至超越语言处理的任务方面的卓越能力。本文报告中,我们深入研究了 LLM 在科学发现环境中的性能,重点关注 GPT-4,这一最先进 - 大型语言模型的零样本假设提出者
大型语言模型 (LLMs) 可以作为催化剂引发新的科学发现,并指导进一步的探索。
- 生命科学的知识图谱:最新发展、挑战与机遇
综述与立场论文中,我们讨论了生命科学中利用基于图的技术的最新进展和应用,并阐述了这些技术对于该领域的未来影响。重点关注知识图谱的构建与管理,知识图谱在新知识发现中的应用,以及知识图谱在支持可解释人工智能方面的应用,并提出了面临的挑战和开放的 - 加速科学模拟与设计的神经运算器
基于神经操作符的人工智能框架为连续域函数之间的映射学习提供了一个原则性框架,通过零样本超分辨率等功能,可以为科学发现和工程设计的模拟和设计提供快速的数据驱动代替,进而带来快速的研究与开发。