- 时间序列分类中的概率性数据补全
本文提出了一个新颖的概率框架,用于处理具有缺失值的多变量时间序列数据的分类问题。通过训练两个部分的模型,一个用于缺失值填补的深度生成模型,一个用于分类的分类器,能够有效地建模填补缺失值带来的不确定性,并且利用新的正则化技术解决了合并模型可能 - 多目标深度学习预测森林参数:伪目标插补训练回归模型
本文提出了一种半监督回归建模方法,通过利用建立于航空激光扫描数据和 C 波段合成孔径雷达的预测地图来生成有效的伪目标训练数据,解决了传统回归模型样本量不足的问题,并成功实现了在坦桑尼亚和挪威的不同地区和森林类型上进行地面生物量和树干体积的预 - 基于隐式神经表示的时间序列连续建模:插值与预测
该研究提出了一种使用隐式神经表示法的时间序列建模方法,能够有效捕捉时间序列的连续性,并提供对处理缺失数据、不规则采样或多个传感器的不对齐观测等常见问题的自然解决方案,并通过实验表明,在预测和填充任务中取得了最先进的性能,能够灵活处理各种具有 - ST-GIN:基于时空图注意力和双向循环联合神经网络的交通数据填充不确定性量化方法
本文提出一种创新的深度学习方法来填充交通数据中的缺失值,采用图形关注架构和双向神经网络来捕捉交通数据中的空间和时间相关性,实验结果表明该方法优于所有基准技术,展示了其有效性。
- 缺失值下的相关性可视化:插补和直接参数估计方法的比较
研究比较了不同的缺失数据方法对相关图的影响,并建议使用直接参数估计方法(DPER)来绘制相关矩阵,以获得更准确的特征之间的关系。
- 基于分块的主成分分析方法用于单调缺失数据插补和降维
提出了一种基于主成分分析的分块数据 PCA 缺失值插补方法,该方法可以通过各种插补技术来减少大数据集上的计算量并验证了其有效性。
- 时间序列应用的扩散模型:一项调查
本篇综述着重探讨了基于扩散模型的时间序列预测、插补和生成方法,并比较了不同应用的方法及其联系,最后总结了现有的限制与未来的发展方向。
- 缺失值下的对事实解释
本文提出了一种新的 CE 框架 CEPIA,通过缺失值插补和操作对的方式实现了有效的解释,并通过无差别最大化问题准确地评估了新框架的表现。
- 医疗数据中的缺失值和填补:可解释机器学习能提供帮助吗?
本文介绍了一种在解决缺失数据问题时使用可解释机器学习的方法。将高精度的玻璃盒可解释性增强机(EBMs)用于缺失值处理,可帮助用户更好地了解缺失机制并检测可能引入的风险。实验表明了该方法在处理真实医疗数据集时的有效性。
- IJCAI缺失数据下的交通信号控制强化学习方法
本文介绍了如何使用强化学习来解决城市道路网络中交通信号控制的问题。我们提出了两种解决方案:第一种方案使用状态值估计来进行自适应控制,第二种方案同时使用状态值和奖励值估计来训练强化学习模型进行自适应控制。我们在合成和实际道路网络交通方面进行了 - 基于时间的迭代插补策略用于多变量纵向临床数据
本文提出了一种简单的新方法,即基于时间依赖的迭代插补(TDI),用于填补临床数据中的缺失值,该方法针对多变量和纵向数据,并基于数据的临床模式(包括缺失率和测量频率)引入了患者、变量和观察特定的动态加权策略。对 MIMIC III 和 COV - CVPR探索和利用不完整多视角分类的不确定性
提出了一个基于不确定性的不完整多视图数据分类模型,通过构建分布来捕捉丢失视图的不确定性,并根据采样质量自适应利用它们来实现更明显的数据填充和可控融合,使用证据融合策略来保证集成填充视图的可靠性和性能,多个基准数据集的实验证明了该方法的优越性 - 数据流形中的多线性核回归和插补
本文介绍了一种基于核的高效多线性非参数逼近框架,应用于动态磁共振成像(dMRI)的数据回归和插值。该多线性模型具有降维、高效计算和提取数据模式和几何形状等特点,在严重欠采样的 dMRI 数据测试中较之以往的方法,包括流行的数据建模方法及最近 - 时间序列健康数据深度填补缺失值:综述与基准评估
本文以五个时间序列健康数据集和六个实验条件为基准,展开数据中心的方法来评估最先进的深度插补方法,发现没有单一的插补方法在所有五个数据集上表现最佳,插补表现取决于数据类型,变量统计,缺失率和类型,这表明在选择多变量时间序列数据的缺失值插补方法 - 单个细胞是空间标记:用 Transformer 填补空间转录组数据
本文介绍一种名为 “SpaFormer” 的基于 transformer 模型的细胞水平空间转录组学数据插补方法,通过对细胞进行位置编码和多头自注意机制,利用 transformer 模型来解决细胞位置信息与长距离空间信息的编码问题,实现了 - 神经连续 - 离散状态空间模型用于不规则采样的时间序列
提出了神经连续 - 离散状态空间模型 (NCDSSM),用于对时间序列进行连续时间建模。该模型使用辅助变量进行识别和动态分离,从而仅需要为辅助变量进行摊销推理。通过连续离散滤波理论,提出了三种灵活的潜在动态参数化方法和一种能够较快地进行后验 - 高维数据中自复制随机森林链的缺失值插补
本文提出了一种基于多标签分类和随机森林的缺失值填充算法,适用于高维低样本数据,尤其适用于单核苷酸多态性数据集,实验证明其优于标准算法。
- 交通时间序列插值的拉普拉斯卷积表示
提出一种基于低秩性和拉普拉斯卷积的 Traffic 数据修复模型模型 (LCR),在各种时间序列数据的实验中比现有基线模型更有效和更高效。
- 解决数据集中缺失问题的方法论研究及其在人口健康数据集中的应用
本研究提出了一种处理健康数据集中缺失数据的方法,通过结合生成合成数据集、缺失数据插补和深度学习方法来解决缺失数据问题,并使用高斯混合模型、聚类、分类和直接插补分析等综合性能分析框架评估,得出当采用 DAE 方法进行插补时,模型的对数损失最低 - 基于自注意力机制的时间序列填补网络:STING
本文提出了一种新的针对多元时间序列数据的缺失值填补方法(STING),它利用了生成对抗网络和双向循环神经网络来学习时间序列的潜在表示,并引入一种新的自注意力机制来捕捉整个序列的加权相关性,实验结果表明,STING 在多个真实数据集上表现出比