材料科学的大数据 - 描述符的关键作用
通过密度泛函理论计算,本文使用化学描述符生成系统性描述符,并构建了一个基于核岭回归模型的机器学习模型,预测化合物的物理性质,预测误差为 0.041 eV/atom,具有良好的预测性能和高效优化的效率。
Nov, 2016
通过统计性属性模型驱动的材料发现是一个迭代决策过程,在此过程中,初始数据集会根据模型所提出的新数据进行扩展,目标是随时间最大化某种 “奖励”,例如迄今为止发现的最大属性值。我们证明了此问题,并提出了一种新颖的性能估计方法,即与基于预计算数据集的 “期望改善” 收购函数预测高斯过程,在双钙钛矿氧化物的示例研究中表现最佳。
Nov, 2023
通过研究两个不同数据集中的六种机器学习技术在材料科学领域的应用,本文分析了这些模型的准确性和稳健性,并阐明了它们性能差异的原因。研究还考察了包含领域知识的影响以及基于训练数据可用性和质量的一般建议。
Sep, 2023
该研究论文介绍了一种新的机器学习框架,用于从现有的材料数据中提取预测模型,方法是使用具有化学多样性的属性列表,并将数据集分成相似材料组,提高预测准确度,可用于预测晶态和非晶材料的多种属性。
Jun, 2016
利用分子描述符和表示学习相结合的方法,通过结合概率机器学习文献中的期望最大化算法,自动检测并纠正基于结构的预测不可靠的情况,从而显著提高了对二元混合物中活度系数的预测准确性,展示了在物理化学性质预测中的潜力。
Jun, 2024
提出了一种利用数据驱动模型加速材料发现优化过程的方法,该方法可以指导科学家先测试最有前途的候选者,并结合不确定性分析为探索高不确定度的候选者和利用参数空间高性能区域提供建议。该方法在材料科学领域的四个测试案例表明,比随机猜测平均少三倍的实验次数就找到了最佳候选方案。
Apr, 2017
应用贝叶斯算法的 SAGE 算法通过多模态核主成分分析将来自不同数据源的知识合并,学习合成 - 结构 - 性能关系,从而克服高维复杂材料搜索空间和知识融合的挑战。
Nov, 2023
本文介绍了一种用于判断计算化学中基于代理模型的不确定性估计质量的方法,利用机器学习中的数字度量指标、模型准确性及校准性检测等,通过各种性能指标来评估模型的质量,及一个使用卷积神经网络和高斯过程回归器的模型对吸附能的预测和不确定性的估计得到了最好的表现。
Dec, 2019
本文介绍了子群发现 (Subgroup discovery, SGD) 作为解释性材料科学数据挖掘方法的应用,SGD 通过密度泛函理论计算数据发现了准确分类№82 个半导二元化合物结构的可解释模型,并在研究金团簇的几何和物理化学性质中发现线性相关规律和描述符。
Dec, 2016