We propose a general modeling framework for marked poisson processes observed
over time or space. The modeling approach exploits the connection of the
nonhomogeneous Poisson process intensity with a density function. Nonparametric
Dirichlet process mixtures for this density, combined w
我们介绍了一种新的非线性分类模型,使用狄利克雷过程混合对反应变量 y 和协变量 x 的联合分布进行非参数建模,并在混合成分内保持 y 和 x 之间的关系线性。如果混合物包含多个成分,则总体关系变成非线性。我们使用模拟数据来比较这种新方法与简单的多项式逻辑模型 (MNL)、带有二次项的 MNL 模型和决策树模型的性能,并在蛋白折叠分类问题上评估我们的方法,发现我们的模型相对于基于神经网络 (NN) 和支持向量机 (SVM) 的先前方法具有实质性改进。蛋白质折叠类别具有分层结构。我们将我们的方法扩展到分类问题,其中有一个类别分层结构。我们发现,使用关于蛋白折叠分层结构的先前信息可以提高预测准确性。
提出了一种新的非参数回归方法:Dirichlet Process mixtures of Generalized Linear Models (DP-GLM),可容纳连续和分类输入以及可以由广义线性模型建模的响应,该文中还给出了 DP-GLM 回归均值函数估计的渐近无偏条件。通过实际数据集分析,与现有回归方法相比,DP-GLM 提供了一个表现良好的单一模型。