从系统视角看事件预测方法综述:融合不同研究领域
稀有事件预测是使用机器学习和数据分析识别和预测低概率事件。由于数据分布不均衡,普通事件的频率远远超过稀有事件,需要在机器学习流程中的每个步骤中使用专门的方法,从数据处理到算法到评估协议。该论文全面综述了稀有事件预测的当前方法在四个方面:稀有事件数据,数据处理,算法方法和评估方法。它旨在找出当前文献中的差距并突出预测稀有事件的挑战。它还提出了潜在的研究方向,可帮助指导从业人员和研究人员。
Sep, 2023
我们研究了在数据点序列中预测和解释事件发生的挑战,特别关注未知触发器导致事件发生的非连续、屏蔽和嘈杂数据点的情况。通过结合分析、仿真和机器学习方法,我们探索、量化和提供了解决此挑战的解决方案,并确证了支持各种变化的通用方程。使用这些方程,我们描述了复杂性如何随各参数变化(例如,明显和隐藏状态的数量、触发器长度、置信度等)而变化,并量化了成功训练机器学习模型所需的数据。我们还证明了我们的机器学习解决方案能够学习和识别未知触发器并预测事件的发生。如果挑战的复杂性过高,我们的机器学习解决方案可以识别触发器候选项,以更高效的方式与正在调查的系统进行交互,以确定真正的触发器。通过分享我们的发现,我们希望帮助其他面临类似挑战的人们,让他们能够估计问题的复杂性、所需数据以及解决方案。
Jun, 2024
此研究针对加拿大埃德蒙顿市的各类紧急事件,通过数据收集、描述性分析、特征分析与选择以及建立预测模型,以不同时间和空间分辨率预测各类事件的发生概率,并对其与社会经济和人口数据的关联进行分析,结果显示模型在大部分事件类型上表现良好,可用于紧急救援服务部门的资源分配和规划,同时研究还发现 COVID-19 对事件发生和预测模型的精度有显著影响。
Feb, 2024
在大数据时代,信息蔓延的预测在大规模信息、专家经验和高精度模型的帮助下带来了巨大机遇。然而,不同学科的专业知识参与导致信息蔓延预测主要专注于特定应用领域(如地震、洪水、传染病)。缺乏统一的预测框架为不同应用领域的交叉预测方法的分类带来了挑战。本文提供了信息蔓延建模、预测和应用的系统分类和总结。我们旨在帮助研究人员识别前沿研究,了解公共紧急情况下信息蔓延预测的模型和方法。通过总结目前存在的问题并概述未来研究方向,本文有潜力成为研究人员进一步研究信息蔓延预测的宝贵资源。
Mar, 2024
通过对 MIMIC-III 数据库中的患者临床事件序列进行分析和测试,我们提出并研究了多种新的事件序列预测模型和方法,旨在更好地调整个体患者和其特定状况的预测。
Aug, 2023
现有研究使用深度学习技术并使用公开的事件日志评估其预测性能,但本文通过实验证据对这些评估方法的有效性提出了质疑,揭示了常用的事件日志中存在大量的样本泄漏,使得相对简单的预测方法与利用深度学习的方法几乎同样表现。我们进一步指出,设计稳健的评估需要更深入地参与下一个活动预测的主题,特别是与对新数据的泛化概念相关的。为此,我们提出了不同类型的泛化引导未来研究的各种预测场景。
Sep, 2023
最近发展的生存分析方法通过在每个预先确定的(离散)时间间隔内预测事件发生的概率来改进现有方法。本研究提出了一种从数据中学习划分事件时间间隔的方法,并在两个模拟数据集和三个真实世界观察数据集上展示了改进的预测性能。我们认为这种方法通过指导最适合每个任务的时间间隔来促进临床决策。
Oct, 2023