M$^2$Hub:解锁机器学习在材料发现中的潜力
本文介绍两个项目 —— 材料数据中心和科学数据及学习中心,解决机器学习在材料科学中的应用问题,通过对例子的分析说明如何实现数据与机器学习模型之间的链接,并通过网络和程序接口访问这些功能。
Apr, 2019
本研究基于局部化学环境和贝叶斯统计学习的机器学习模型,提供了一个统一的框架,可以预测原子尺度的稳定性和不同类别的分子的化学精度,可以区分活性和非活性的蛋白质配体,这种方法可以对材料和分子的势能面提供新的洞察。
Jun, 2017
该研究论文介绍了一种新的机器学习框架,用于从现有的材料数据中提取预测模型,方法是使用具有化学多样性的属性列表,并将数据集分成相似材料组,提高预测准确度,可用于预测晶态和非晶材料的多种属性。
Jun, 2016
介绍了 Open MatSci ML 工具包,即可扩展、自包容能力强,并使用 Python 框架基于深度学习模型和方法对科学数据进行处理,特别关注材料科学和 OpenCatalyst 数据集,展示了这一工具包为新机器学习研究人员和 OpenCatalyst 数据集应用高级机器学习工具等科学挑战提供了无缝的解决方案,并为某些材料的行为提供了建模。
Oct, 2022
通过研究两个不同数据集中的六种机器学习技术在材料科学领域的应用,本文分析了这些模型的准确性和稳健性,并阐明了它们性能差异的原因。研究还考察了包含领域知识的影响以及基于训练数据可用性和质量的一般建议。
Sep, 2023
本文调查了文献中关于基于组成和基于结构的材料属性预测的过高 ML 性能,提出了一种材料数据集冗余降低算法 MD-HIT,并通过几个组成和结构基础的距离阈值评估其性能,结果表明,通过这种方法,预测性能更能反映其真实的预测能力。
Jul, 2023
近年来,加速材料创新引起了学术界和工业界的广泛关注。为了为新型先进材料的开发增添价值,必须考虑制造过程,并将材料设计方法与下游工艺设计相结合。本研究提出了一种整体优化方法,涵盖了整个材料的过程 - 结构 - 性能链。采用机器学习技术解决了两个关键的识别问题,即材料设计问题和工艺设计问题。我们应用强化学习与多任务学习的优化方法,在金属成型过程中制造具有所需属性的晶体纹理,展示了该方法的功能。
Dec, 2023
提出了 MatSci ML,这是一个用于建模具有周期晶体结构的固态材料的机器学习(MatSci ML)方法的新型基准。使用机器学习方法研究固态材料是一个新兴领域,由于使用不同种类的数据集来开发机器学习模型,导致了碎片化的情况,使得比较不同方法的性能和泛化能力变得困难,从而阻碍了该领域的研究进展。MatSci ML 基准建立在开源数据集的基础上,包括 OpenCatalyst、OQMD、NOMAD、Carolina 材料数据库和 Materials Project 等大规模数据集,为模型训练和评估提供了多样化的材料系统和属性数据,包括模拟能量、原子力、材料能隙,以及通过空间群对结晶对称性进行分类的数据。MatSci ML 中的属性多样性使得实施和评估固态材料的多任务学习算法成为可能,而数据集的多样性则促进了跨多个数据集开发新的更广义的算法和方法。在多数据集学习环境中,MatSci ML 使研究人员能够结合来自多个数据集的观测结果,进行共同预测共同属性,如能量和力。使用 MatSci ML,我们评估了不同的图神经网络和等变点云网络在涵盖单一任务、多任务和多数据学习场景的几个基准任务上的性能。我们的开源代码可在指定的 https URL 上找到。
Sep, 2023
分析转移学习在分子和材料科学中的应用和近期进展,重点关注转移学习方法在高级分子和材料的发现中的应用,不同系统下转移学习框架的构建以及如何提高模型性能,并讨论了转移学习面临的挑战。
Mar, 2024
MoleculeNet 是一个大规模分子机器学习基准测试,为多种先前提出的分子特征化和学习算法提供高质量的开源实现,并证明了可学习的表示是分子机器学习的强大工具,但其性能受到数据稀缺和高度不平衡分类的影响,物理感知特征化的使用对于量子力学和生物物理数据集更为重要。
Mar, 2017