Jul, 2023

MD-HIT:用于材料性能预测的机器学习及数据集冗余控制

TL;DR本文调查了文献中关于基于组成和基于结构的材料属性预测的过高 ML 性能,提出了一种材料数据集冗余降低算法 MD-HIT,并通过几个组成和结构基础的距离阈值评估其性能,结果表明,通过这种方法,预测性能更能反映其真实的预测能力。