KDDDec, 2023

一个基于漂移检测的在线、自适应和无监督回归框架,适用于标签稀缺环境

TL;DR在实时标签获取困难的场景中,本文提出了一种适用于有限标记数据的流式环境的最优策略,引入了一种自适应的无监督回归技术。该方法利用一组稀疏的初始标签,并引入创新的漂移检测机制,以响应数据中不断变化的模式实现动态模型调整。通过将 ADWIN 算法与基于 RMSE 的误差广义化相结合,我们提高了适应性。ADWIN 实现了实时漂移检测,而 RMSE 提供了对模型预测准确性的稳健度量。该组合使得我们的多变量方法能够有效地应对流式数据的挑战,在保持高水平的预测准确性的同时不断适应变化的模式。最后,我们对各种公共数据集评估了我们的多变量方法的性能,并将其与非适应性基线进行比较。通过综合评估,我们证明了我们的自适应回归技术在实时标签获取具有挑战性的任务中的出色效果。结果突显了该方法超越传统方法的能力,并凸显了在标签稀缺和数据模式不断变化的情境中的潜力。