Feb, 2024

AI 模型卡片中的记录:对 32K 个 AI 模型卡片进行系统分析

TL;DR通过对 AI 模型的 32,111 份文档进行全面分析,我们发现 AI 模型的文档化做法存在不足,其中环境影响、限制和评估等方面填写的比例最低,而训练部分则是填写最完整的。此外,我们发现数据的讨论相当重要,有时甚至比模型本身还要强调。通过将详细的模型卡添加到之前没有或只有少量模型卡的 42 个热门模型,我们发现添加模型卡 moderately 相关于周下载量的增加。通过大规模数据科学和语言学分析,我们的研究为分析模型文档化的社区规范和实践打开了新的视角。