稀有事件建模的变分分离
稀有事件预测是使用机器学习和数据分析识别和预测低概率事件。由于数据分布不均衡,普通事件的频率远远超过稀有事件,需要在机器学习流程中的每个步骤中使用专门的方法,从数据处理到算法到评估协议。该论文全面综述了稀有事件预测的当前方法在四个方面:稀有事件数据,数据处理,算法方法和评估方法。它旨在找出当前文献中的差距并突出预测稀有事件的挑战。它还提出了潜在的研究方向,可帮助指导从业人员和研究人员。
Sep, 2023
本文综述了流行的生成模型,讨论了去解开深层神经网络的黑盒问题,通过分离潜在表征,提高对医学数据生成过程的控制和可解释性,从而在不侵犯病人隐私的前提下合成人工医学数据集,发掘数据生成特征,以及在医疗应用中获取新的结论。
Mar, 2022
本研究旨在提出适用于顺序决策系统的两种自适应重要性采样算法,以高效地评估罕见事件的概率。该方法基于状态依赖的提议分布与目标分布之间的 Kullback-Leibler 散度最小化,用于减少精度方面的误差和处理多峰性提议分布的问题,并将多重重要性采样应用于多种基线以显示准确性改进。
Nov, 2022
本文介绍了一种基于半监督概率方法的生存数据聚类技术,使用了深度生成模型解决了未知基础变量和被检查的存活时间分布的问题,并在广泛的数据实验中取得了良好的效果和表现。
Jun, 2021
本文介绍了一种概率深度学习模型,名为 Variational Imbalanced Regression (VIR)。该模型可以在标记分布不平衡的情况下,准确地进行回归,并自然地产生合理的不确定度估计,实验证明我们的 VIR 在准确性和不确定度估计方面均可优于现有的不平衡回归模型。
Jun, 2023
该论文在事件建模和理解的背景下,提出了一种新的神经序列建模方法,该方法考虑了离散的、部分被观察到的外部知识序列。通过构建一个顺序神经变分自编码器,在精心定义的编码器中使用 Gumbel-Softmax 重参数化技术,允许半监督的外部离散知识在训练期间指导但不限制变分潜在参数。实验表明,该方法不仅优于多个基线和叙事脚本归纳的最新技术,而且收敛速度更快。
Oct, 2020
针对学习解耦表示是表示学习中重要的问题,本文调查研究了少量监督如何影响现有的解耦学习方法,并进行了大规模实验,结果表明,即使标签不完全或不准确,使用少量的标记训练样本可以对现有的解耦学习模型进行模型选择,并证实引入监督可以有效地学习解耦表示。
May, 2019
提出了一种基于多输出高斯过程的灵活、可扩展的联合模型来解决缺失和噪声问题,利用模型估计事件发生的概率来推测事件,通过置信度准则和代价分析进行事件预测.
Aug, 2017
本文提出了一种基于移动传感器数据来检测罕见生活事件的多任务框架,通过使用格兰杰因果性和无监督自编码器以及辅助序列预测器来提高检测准确性,结果显示该方法的 F1 值达到了 0.34,表现优于多个基线,结果为罕见事件检测提供了有效的方法。
May, 2023