Dec, 2019
垃圾输入,垃圾输出?社交计算机中的机器学习应用论文是否报道了人工标记训练数据的来源?
Garbage In, Garbage Out? Do Machine Learning Application Papers in Social Computing Report Where Human-Labeled Training Data Comes From?
R. Stuart Geiger, Kevin Yu, Yanlai Yang, Mindy Dai, Jie Qiu...
TL;DR本文研究了在社交计算领域,针对 Twitter 数据执行 ML 分类任务,是否具有遵循模板的最佳实践方法,结果显示,大多数人都没有遵循规则,从而导致数据不可靠。