Feb, 2016

网络关联数据的预测模型

TL;DR本研究探讨了在众多现代应用中,训练数据中可能存在互相连接的个体不独立样本的情况下,预测算法的表现。我们提出了一种基于网络的罚函数来鼓励联通节点的预测相似性,并证明了将其应用于预测模型能够在现实和理论上得到显著的表现改进,特别在存在网络内部联系的情况下。此罚函数可以与许多基于损失的预测模型相结合,如回归模型,广义线性模型和 Cox 比例危险模型。通过对青少年的探险行为和大麻使用水平的预测研究,我们发现了这种方法对预测行为的提高是有效的,并且提供了对变量效应估计的说明。