Nov, 2023

数据库中一些难以捉摸的方面对基于人工智能的发现的阻碍:以超导材料为例的案例研究

TL;DR大数据和 AI 驱动模型的准确性和质量对于建立准确的人工智能模型至关重要。然而,在根本性数据库生成中存在一些关键障碍,这些常常在文献中被低估并且得到很少的讨论。在本文中,我们特别针对超导和热电材料进行了两个代表性案例研究,讨论了三个方面,即内在有偏采样选择,可能的隐藏变量,以及不同的数据年龄。值得注意的是,据我们所知,我们提出并测试了第一个能够检测和量化内在数据偏差的策略。