Dec, 2023
第三方机器学习模型和数据集的文档实践现状
The State of Documentation Practices of Third-party Machine Learning Models and Datasets
Ernesto Lang Oreamuno, Rohan Faiyaz Khan, Abdul Ali Bangash, Catherine Stinson, Bram Adams
TL;DR本研究使用统计分析和混合卡片排序评估了 Hugging Face 模型存储库中模型卡片和数据集卡片的记录实践,发现只有 39.62% 的模型和 28.48% 的数据集有文档记录,同时还观察到 ML 模型和数据集的伦理和透明度相关文档存在不一致性。