从材料科学合成程序中自动提取行为图

NIPSNov, 2017

从材料科学合成程序中自动提取行为图

Automatically Extracting Action Graphs from Materials Science Synthesis Procedures

Sheshera Mysore, Edward Kim, Emma Strubell, Ao Liu, Haw-Shiuan Chang...

TL;DR本文介绍了一种自动从物质科学期刊文章中提取无机化合物实验合成结构化信息的系统，定义为一组链接事件，由提取的科学实体构成，同时评估了两种无监督方法和多种有监督模型。

Abstract

computational synthesis planning approaches have achieved recent success in organic chemistry, where tabulated synthesis procedures are readily available for supervised learning. The syntheses of inorganic materials

computational synthesis planning inorganic materials structured representations scientific entities procedural text

发现论文，激发创造

材料科学程序文本语料库：浅层语义结构标注的材料合成过程

本论文介绍推出的通过标记图表达句子语义、带有经验标注的 230 个物质合成程序数据集，旨在为材料科学领域进行材料合成的自动计划和科学信息提取等方面的研究和开发提供支持。

May, 2019

基于文献训练的神经网络的无机材料合成规划

本文介绍一项基于语言模型的自动化方法，通过自然文本连接文献与合成洞见，提高材料设计和发现速度，并展示该方法在预测钙钛矿材料先驱体和筛选新化合物方面的潜力。

Dec, 2018

从科技文献中注释并提取全固态电池的合成过程

本文提出了一种基于深度学习的序列标记器和简单启发式规则的关系抽取器的自动化机器阅读系统，通过流程图定义合成过程的表示，并从 243 篇论文实验部分创建一个关于全固态电池的合成过程的新语料库。我们的实验结果表明，序列标记器可以检测实体，宏平均 F1 分数为 0.826，同时基于规则的关系抽取器的宏平均 F1 分数为 0.887。

Feb, 2020

PcMSP：用于从多晶材料合成流程文本中提取科学动作图谱的数据集

本文介绍了 Polycrystalline Materials Synthesis Procedures 数据集及其构建过程，以及对数据集进行自然语言处理的方法和实验结果，旨在为材料科学信息提取提供标注数据，并解决该领域中标注数据匮乏的问题。

Oct, 2022

基于代理的从科学文献中学习材料数据集

通过使用大型语言模型（LLMs）创建化学家 AI 代理程序，本研究克服了通过自动创建从自然语言文本中提取结构化数据集所面临的质量和一致性问题、可扩展性限制、以及人为错误和偏见的风险，进而简化了各种材料发现应用的机器学习数据集的编制，以及对自然语言处理工具的易用性提升。

Dec, 2023

运用自然语言处理技术分析无机材料文献的研究趋势

该研究提出了一种基于自然语言处理的大规模流程，用于从材料科学文献中提取材料名称和特性，以便进行材料科学的搜索和检索。实验证明这种方法是成功的，可以用来分析材料科学的趋势，如 MoS2 等材料在中国不断增加，而在美国减少。

Jun, 2021

无监督学习食谱图

提出一种无监督学习的方法，使用图表示法从烹饪食谱中提取相关信息，并通过解码图成文本进行监督，与其他方法相比，使用文本到图和图到文本的方式迭代学习图结构和参数，并通过与标注数据集的实体对比、输入和输出文本的差异对比以及与现有方法生成的图的对比来评估该方法。

Jan, 2024

学习规划化学合成

研究者利用深度神经网络和 Monte Carlo Tree Search 相结合的方法，通过训练为所有有机化学反应提供未来的化合物转化路径，从而加速了药物和材料的发现，并启用完全自动的机器人合成。

Aug, 2017

根据书本玩游戏：从文本中提取动作网络的交互式游戏方法

提出一种新的方法 Text2Quest，将过程文本解释为交互式游戏的说明，以从材料科学论文中提取动作图形。该方法可以补充现有方法，并实现比静态文本更丰富的学习形式。

Nov, 2018

DiSCoMaT：从材料科学论文表格中进行远程监督的组分提取

本文研究了从科技领域出版的文章中提取表格的信息提取，针对特定的难题：材料组成提取，建立了训练数据集和 DiSCoMaT 表格数据处理框架，并取得了显著的表现。

Jul, 2022