datasets play a central role in the training and evaluation of machine
learning (ML) models. But they are also the root cause of many undesired model
behaviors, such as biased predictions. To overcome this situation, the ML
community is proposing a data-centric cultural shift where dat
本文提供了人工智能和机器学习领域数据许可的分类,以建立类似于开源软件许可证的通用框架。新的数据许可语言 —— 蒙特利尔数据许可证(MDL)以及配套的基于 Web 的工具可以奉行本文所阐述的税 onomies。其目的是通过增加透明度,解决现有许可证文本中概念上的模糊之处,从而在 AI 和 ML 领域带来更清晰的工具和概念,使数据市场更公平,更有效。