材料科学的大数据 - 描述符的关键作用

Nov, 2014

材料科学的大数据 - 描述符的关键作用

Big Data of Materials Science - Critical Role of the Descriptor

Luca M. Ghiringhelli, Jan Vybiral, Sergey V. Levchenko, Claudia Draxl, Matthias Scheffler

TL;DR通过分析材料学中的描述符选择问题，定义了一个合适的描述符要求，并以典型半导体结构的能量差为例，演示了如何系统地找到有意义的描述符。

Abstract

statistical learning of materials properties or functions so far starts with a largely silent, non-challenged step: the choice of the set of descriptive parameters (termed →

statistical learning materials properties descriptor causality semiconductors

发现论文，激发创造

材料数据机器学习描述符

该论文阐述了如何将化合物表示为描述符，并将其应用于材料数据的机器学习模型。

Sep, 2017

利用机器学习预测分子物理性质的化合物表示方法

通过密度泛函理论计算，本文使用化学描述符生成系统性描述符，并构建了一个基于核岭回归模型的机器学习模型，预测化合物的物理性质，预测误差为 0.041 eV/atom，具有良好的预测性能和高效优化的效率。

Nov, 2016

从预测到行动：适当性能估计在基于机器学习的材料发现中的关键作用

通过统计性属性模型驱动的材料发现是一个迭代决策过程，在此过程中，初始数据集会根据模型所提出的新数据进行扩展，目标是随时间最大化某种 “奖励”，例如迄今为止发现的最大属性值。我们证明了此问题，并提出了一种新颖的性能估计方法，即与基于预计算数据集的 “期望改善” 收购函数预测高斯过程，在双钙钛矿氧化物的示例研究中表现最佳。

Nov, 2023

高效材料科学模拟的代理模型：基于机器学习预测微观组织性质

通过研究两个不同数据集中的六种机器学习技术在材料科学领域的应用，本文分析了这些模型的准确性和稳健性，并阐明了它们性能差异的原因。研究还考察了包含领域知识的影响以及基于训练数据可用性和质量的一般建议。

Sep, 2023

一般性用途的无机材料属性预测机器学习框架

该研究论文介绍了一种新的机器学习框架，用于从现有的材料数据中提取预测模型，方法是使用具有化学多样性的属性列表，并将数据集分成相似材料组，提高预测准确度，可用于预测晶态和非晶材料的多种属性。

Jun, 2016

平衡分子信息与实证数据在物理 - 化学性质预测中的应用

利用分子描述符和表示学习相结合的方法，通过结合概率机器学习文献中的期望最大化算法，自动检测并纠正基于结构的预测不可靠的情况，从而显著提高了对二元混合物中活度系数的预测准确性，展示了在物理化学性质预测中的潜力。

Jun, 2024

使用数据驱动的实验设计和好校准的不确定性估计进行高维材料和工艺优化

提出了一种利用数据驱动模型加速材料发现优化过程的方法，该方法可以指导科学家先测试最有前途的候选者，并结合不确定性分析为探索高不确定度的候选者和利用参数空间高性能区域提供建议。该方法在材料科学领域的四个测试案例表明，比随机猜测平均少三倍的实验次数就找到了最佳候选方案。

Apr, 2017

通过数据融合学习材料的结构 - 性能关系：贝叶斯共区相关 N 维分段函数学习

应用贝叶斯算法的 SAGE 算法通过多模态核主成分分析将来自不同数据源的知识合并，学习合成 - 结构 - 性能关系，从而克服高维复杂材料搜索空间和知识融合的挑战。

Nov, 2023

比较材料属性预测的不确定性量化方法

本文介绍了一种用于判断计算化学中基于代理模型的不确定性估计质量的方法，利用机器学习中的数字度量指标、模型准确性及校准性检测等，通过各种性能指标来评估模型的质量，及一个使用卷积神经网络和高斯过程回归器的模型对吸附能的预测和不确定性的估计得到了最好的表现。

Dec, 2019

通过子群发现揭示材料结构 - 性质相关性

本文介绍了子群发现 (Subgroup discovery, SGD) 作为解释性材料科学数据挖掘方法的应用，SGD 通过密度泛函理论计算数据发现了准确分类№82 个半导二元化合物结构的可解释模型，并在研究金团簇的几何和物理化学性质中发现线性相关规律和描述符。

Dec, 2016