- 天文学研究中大型语言模型评估框架设计
大型语言模型(LLMs)正在改变科学研究的方式。我们提出了一个在天文学领域评估研究者与 LLMs 交互的实验设计,并通过一个 Slack 聊天机器人来回答用户的查询,所用的响应取自 arXiv 上的天文学论文。我们记录并匿名用户的问题和机器 - StatWhy:统计假设检验程序的形式化验证工具
应用形式化规范方法和自动验证技术,开发了一种检验统计程序正确性的新方法,可以避免在科学研究中广泛存在的统计方法滥用和误解问题。
- 科学文章中使用 Bi-LSTM-CRF 模型进行数据集提取
本论文基于 Bi-LSTM-CRF 架构的神经网络,提出了从科学文章中自动提取数据集提及的解决方案,并在社会科学文章中的 Rich Context 数据集上实现了 F1 = 0.885 的效果,同时讨论了当前数据集的局限性和未来模型的改进方 - SciFIBench:科学图表解读大型多模态模型基准测试
SciFIBench 是一个科学图表解释的基准测试,评估了 26 个大型多模态模型在理解和解释图表方面的能力,并探究了模型在拓展问题集上的对齐和推理准确性。
- ResearchAgent:基于大型语言模型的科学文献上迭代研究创意生成
提出了一种基于大型语言模型的研究思路写作代理 ——ResearchAgent,它在科学文献的基础上自动生成问题、方法和实验设计,并通过连接学术图谱中的信息和从基于实体为中心的知识库中提取的实体进行逐步改进。此外,通过与多个 Reviewin - 科学文献是多语种的,我们的模型也应如此
英语一直被认为是科学研究的 $ extit {lingua franca}$,然而,该研究表明文献主要以多种语言出现,因此建议当前的模型和基准应该体现这种语言多样性,以提高在非英语文献上的表现。
- 混合人工和自然智能:从统计力学到人工智能再到湍流
未来的人工智能在科学研究中的作用,特别关注湍流研究,并通过基于非平衡统计力学的扩散模型,研究人工智能的演变。通过创新地使用深度神经网络,强调了人工智能在推进减少的拉格朗日湍流模型方面的重要影响。此外,该论文还审查了湍流研究中各种其他人工智能 - 等离子体系统降阶建模的数据驱动式局部运算符确定:I. 概念和验证
该论文介绍了一种名为 Phi 方法的新算法,它通过受到数值离散化方案启发的有约束回归来发现离散化微分方程组,以提供可靠和稳健的降阶模型(ROMs),并展示了该方法在不同测试案例中的性能,强调了该方法在转变等离子体系统建模方面的潜在应用。
- 从提示工程到提示科学:人类参与的循环中
基于代码书的质性研究方法灵感,通过人工参与与多阶段验证过程,建立了一种更系统、客观和可信的 LLM 数据分析方法,去除主观性、提高透明度和可复制性。
- 用于代码生成和数据分析的科学语言模型
该研究报告关注大型语言模型在科学研究中的应用,调查了使用 LLM 工具的若干实际案例,特别是与软件工程相关的用例,结果显示了大型语言模型工具的潜力和问题。
- DORIS-MAE: 使用多级方面查询的科学文档检索
提出了一种新颖的任务 —— 使用多层面基于方面的查询的科学文档检索(DORIS-MAE),旨在处理科学研究中用户查询的复杂性。通过在计算机科学领域建立一个包含 100 个人工编写的复杂查询案例的基准数据集,并为每个复杂查询集合中的 100 - 人工智能赋能研究:科学从人工智能中获益的 10 种方式
人工智能对科学研究的转变影响进行了探索,突出了人工智能革新科学家工作的十种方式,包括强大的引用工具、对研究问题的改进理解、优化研究设计、数据生成和数据转换、高级数据分析和人工智能辅助报告,并且强调了人工智能可以增强科学中的人类创造力但不能取 - 协作科学的激励理论贝叶斯推演
当研究中存在拥有私人先验的代理者和希望基于参数值做出决策的主要决策者时,研究探讨了假设检验,以维护科学严谨性,并使用代理者的战略行为来进行统计推断。
- 量化人工智能对科学研究的益处
通过对 8700 万篇论文和 710 万项专利采用自然语言处理技术,研究发现 AI 在科研中的使用范围广泛,特别是自 2015 年以来增长迅速,使用 AI 的论文影响因子更高,同时也存在 AI 人才供需不平衡和种族、性别等方面的不公平问题。
- 偏微分方程与深度神经网络的结合:综述
本文对深度神经网络用于偏微分方程 (PDEs) 求解的现状和潜在应用进行了综述,分析和分类了相关方法在科学研究和工程场景中的应用,介绍了这一领域的来源、历史、特点、类型以及未来趋势。
- AAAI人工智能相互作用在人机交互界面设计中的新应用
探讨了人类意识到的机器智能(human-aware AI)如何应用于人机交互(HRI),从观察时序设计算法,真正改变了人们对人工智能和科学研究的看法。
- IdeaReader: 科学出版物理解思路流程的机器阅读系统
IdeaReader 是一种机器阅读系统,可帮助研究人员理清科学文献的演化和思想的流向,并对相关论文进行自动文献综述和思想流程可视化。
- 基因疾病关联关系抽取基线构建:一项可复现性研究
本文介绍了使用自动化系统 DEXTER 从生物医学摘要中提取基因疾病关联(GDAs)的工作,旨在为未来的关系提取研究提供基准,以启用研究人员测试和比较其结果。
- SAIBench:科学人工智能基准测试
该研究提出了一种名为 SAIBench 的系统,它使用专业语言 SAIL 分离科研问题,人工智能模型,排名标准和软硬件配置,以便在不同学科领域评估人工智能解决方案并提供低摩擦度入门。
- 机器学习中知识与数据的融合
该研究总结和分析了现有文献,确定了研究空白和未来机遇。知识嵌入和知识发现是整合知识和数据的两种重要方法,结合知识嵌入和知识发现形成一个闭环的知识生成和使用,可以提高模型的鲁棒性和准确性,并发现之前未知的科学原理。