Jan, 2024

Rastro-DM: 带有轨迹的数据挖掘

TL;DR这篇论文提出了一种用于记录数据挖掘(DM)项目的方法学,Rastro-DM(Trail Data Mining),其关注点不是生成的模型,而是其构建背后的过程,以留下计划行动、完成的训练、获得的结果和经验教训的痕迹。这些提出的实践方法是对 DM 结构化方法学(如 CRISP-DM)的补充,其为 DM 过程建立了方法论和范式框架。最佳实践及其好处的应用在一个名为 'Cladop' 的项目中进行了说明,该项目用于分类与对巴西联邦公共财政的损害调查过程有关的 PDF 文档。在项目背景下构建 Rastro-DM 工具包只是一个小步骤,可以通过在企业内共享和使用痕迹来实现机构性的飞跃。