大数据时代的事件预测:系统调查
稀有事件预测是使用机器学习和数据分析识别和预测低概率事件。由于数据分布不均衡,普通事件的频率远远超过稀有事件,需要在机器学习流程中的每个步骤中使用专门的方法,从数据处理到算法到评估协议。该论文全面综述了稀有事件预测的当前方法在四个方面:稀有事件数据,数据处理,算法方法和评估方法。它旨在找出当前文献中的差距并突出预测稀有事件的挑战。它还提出了潜在的研究方向,可帮助指导从业人员和研究人员。
Sep, 2023
我们研究了在数据点序列中预测和解释事件发生的挑战,特别关注未知触发器导致事件发生的非连续、屏蔽和嘈杂数据点的情况。通过结合分析、仿真和机器学习方法,我们探索、量化和提供了解决此挑战的解决方案,并确证了支持各种变化的通用方程。使用这些方程,我们描述了复杂性如何随各参数变化(例如,明显和隐藏状态的数量、触发器长度、置信度等)而变化,并量化了成功训练机器学习模型所需的数据。我们还证明了我们的机器学习解决方案能够学习和识别未知触发器并预测事件的发生。如果挑战的复杂性过高,我们的机器学习解决方案可以识别触发器候选项,以更高效的方式与正在调查的系统进行交互,以确定真正的触发器。通过分享我们的发现,我们希望帮助其他面临类似挑战的人们,让他们能够估计问题的复杂性、所需数据以及解决方案。
Jun, 2024
此研究针对加拿大埃德蒙顿市的各类紧急事件,通过数据收集、描述性分析、特征分析与选择以及建立预测模型,以不同时间和空间分辨率预测各类事件的发生概率,并对其与社会经济和人口数据的关联进行分析,结果显示模型在大部分事件类型上表现良好,可用于紧急救援服务部门的资源分配和规划,同时研究还发现 COVID-19 对事件发生和预测模型的精度有显著影响。
Feb, 2024
在大数据时代,信息蔓延的预测在大规模信息、专家经验和高精度模型的帮助下带来了巨大机遇。然而,不同学科的专业知识参与导致信息蔓延预测主要专注于特定应用领域(如地震、洪水、传染病)。缺乏统一的预测框架为不同应用领域的交叉预测方法的分类带来了挑战。本文提供了信息蔓延建模、预测和应用的系统分类和总结。我们旨在帮助研究人员识别前沿研究,了解公共紧急情况下信息蔓延预测的模型和方法。通过总结目前存在的问题并概述未来研究方向,本文有潜力成为研究人员进一步研究信息蔓延预测的宝贵资源。
Mar, 2024
本研究提出了一种以聚类为基础的实时事件发现系统,能够将 Twitter 上的实时数据进行聚类,识别出不同的事件,并使用 novel metric 评估聚类方法的效果和在实时和线下模式下的表现,实验结果表明该系统在大规模数据上具有很高的效率和准确性。
Jul, 2019
通过对 MIMIC-III 数据库中的患者临床事件序列进行分析和测试,我们提出并研究了多种新的事件序列预测模型和方法,旨在更好地调整个体患者和其特定状况的预测。
Aug, 2023
本文研究复杂事件识别技术中的不确定性,并回顾了基于自动机、概率图模型和一阶逻辑等技术以及基于 Petri 网和语法的方法,提出了它们存在的一些限制,并针对性地指出未来研究的方向。
Feb, 2017