Sep, 2024

数据过多会造成危害:优化数据覆盖以减轻超快速机器学习势能中的多样性引起的欠拟合

TL;DR本研究解决了机器学习原子势能(MLIPs)中训练数据生成优化的挑战,特别是在数据多样性对模型性能影响的研究中。通过分析超快速力场(UF$^3$)在建模非晶氮化硅中的表现,发现既不足又过度的数据多样性都会降低模型的模拟精度,提出了根据特定应用优化训练数据的重要性。