Nov, 2023

处理重叠非对称数据 — 双重惩罚 P - 样条方法

TL;DR本研究旨在开发一种新方法,能够模拟较小样本与特定响应之间的关系,并考虑较大样本。通过非参数模型和柔性平滑技术,我们提出了一个经过两次惩罚的 P-Spline 逼近方法,通过对较大和较小样本中已存在的协变量的边际值的差异进行惩罚,得到了比线性 B-Spline 和一次惩罚 P-Spline 逼近更好的模型拟合效果。在将其应用于非酒精性脂肪肝风险相关的真实数据集时,我们发现我们的方法可以显著改善模型拟合性能超过 65%。未来的工作包括对方法进行维度约减和考虑参数建模方法的改进,但据我们所知,这是第一个在柔性回归中提出额外边际惩罚的研究,能够考虑到不对称数据集而无需缺失数据插补。