- 用于预测火灾和其他紧急事件的统计和机器学习模型
此研究针对加拿大埃德蒙顿市的各类紧急事件,通过数据收集、描述性分析、特征分析与选择以及建立预测模型,以不同时间和空间分辨率预测各类事件的发生概率,并对其与社会经济和人口数据的关联进行分析,结果显示模型在大部分事件类型上表现良好,可用于紧急救 - 快速自适应预测区间的回归树
提供一种新的方法,用于校准具有局部覆盖保证的回归问题的预测区间,该方法基于训练回归树和随机森林的合规得分创建最粗糙的特征空间划分,适用于各种合规得分和预测设置,且在模拟和实际数据集中表现出比现有基准更优的可扩展性和性能。
- 预测模型模拟的代理限制
适应预测模型为基础的 AI 助手存在结构上的两个失败原因:自我暗示的错觉和预测 - 策略不一致。通过引入来自环境的反馈循环可以解决这两个问题,并验证了理论和实证分析的一致性。
- 多保真物理受限神经网络用于动力学系统
通过引入不同保真度的数据和多个解码器,基于低保真度数据在统一潜变量空间评估物理约束,通过 MSPCNN 方法在训练高度相关的预测模型时实现了训练效率和准确性的权衡。
- 自适应预测缺失数据的优化
训练具有缺失条目的预测模型时,我们可以利用两阶段自适应优化问题来处理缺失数据,并提出了一种新类模型,即自适应线性回归模型,其中回归系数根据观测特征进行自适应。我们展示了一些自适应线性回归模型等价于同时学习一个填充规则和一个下游线性回归模型, - FairEHR-CLP:面向多模态电子健康记录的公平感知临床预测中的对比学习
在保健医疗的高风险领域中,确保预测模型的公平性至关重要。我们提出了一种针对电子健康记录(EHRs)的公平感知临床预测的通用框架 FairEHR-CLP,它通过对比学习的方式在两个阶段操作,利用患者人口统计学、纵向数据和临床记录。这一框架在多 - 地理空间差异:巴黎房地产价格案例研究
通过提出一个工具包,我们着重强调了在预测模型中识别和纠正偏见和校准错误的关键需求,特别是当算法变得更加复杂和难以解释的情况下,以解决由地理信息引起的偏见问题。我们使用巴黎房地产数据集来说明我们的方法,并审查选择地理聚合水平对公平性和校准度量 - 启发机器像化学家一样思考:用层次符号回归揭示分子结构 - 极性关系
薄层色谱(TLC)是分子极性分析中关键的技术,但对 TLC 的预测模型的解释性,尤其是由人工智能驱动的模型,仍然存在挑战。为了弥合这一差距,我们引入了无监督的分层符号回归(UHiSR),结合了分层神经网络和符号回归。UHiSR 自动提取了具 - 从公开的 Spotify 播放列表中挖掘用户属性
在数字音乐流媒体时代,Spotify 平台上的播放列表已成为个人音乐体验的重要组成部分,本文研究了 Spotify 用户的属性与其公开播放列表之间的关系,并创建了准确的预测模型。
- 简化交叉验证:高效地导出列向正规化和标准化的训练集 X'X 和 X'Y,避免全量重新计算矩阵乘积或统计矩
本文介绍了三种有效计算未见数据集上预测模型性能的算法,它们在计算复杂度和正确性方面表现优越,并且相比于直接交叉验证和快速交叉验证的先前工作,它们提供了显著的交叉验证加速,而无需数据泄漏。同时,本文还重点介绍了这些算法与改进的 Kernel - 基于眼动和头部姿势数据评估有条件自动驾驶车辆中驾驶员的准备性
通过组合头部姿势特征和眼动数据,该研究综合分析了驾驶员准备就绪评估的有效性,采用机器学习技术和双向 LSTM 架构模拟了驾驶员准备就绪状态,实现了在 DMD 数据集上的优异评估性能。
- 可解释的脑 - 机接口人工智能方法:回顾与设计空间
本综述论文提供了应用于脑机接口的可解释人工智能技术的整合视角。对大脑信号进行解释的预测模型在各种高风险应用中使用。然而,在这些复杂模型中实现可解释性是具有挑战性的,因为这会损害准确性。为了解决脑机接口的可解释性需求,提出了可解释人工智能为脑 - 通道和序列的舞动:一种高效的基于注意力的多元时间序列预测方法
我们介绍了 CSformer 模型,它通过精心设计的两阶段自注意机制实现了序列特定和通道特定信息的提取,并引入了序列适配器和通道适配器,以促进各个维度之间的协同和相互增强,从而显著提高了多变量时间序列数据的特征提取能力。
- 个性化情感预测中的不确定性建模与规范化流
提出了一种使用条件归一化流来捕捉预测的不确定性的新方法,该方法能够模拟复杂的多模态分布,提供更准确的不确定性估计,并在主观自然语言处理任务中显著超越传统解决方案。
- EMNLP对比短语突出解释:辅助人类发现翻译差异的案例研究
基于对比方式生成强调对预测结果解释的相似指标,该技术比流行的事后重要性技术更好地匹配了人类的跨语义差异解释,并成功地帮助人们检测到人工翻译和机器翻译错误的细微语义差异。
- 从原则到实践:垂直数据最小化用于机器学习
通过数据泛化提出了基于垂直数据最小化的工作流,旨在训练和部署遵循数据最小化原则的机器学习模型,以减少数据泄露风险并保护客户隐私。提出了一种基于政策对齐的对抗场景量化方法,并设计了一种特别有效的垂直数据最小化算法。
- 使用机器学习算法预测棋 960 结果并发展开局主题
这项研究集中于分析象棋 960(又称费舍尔随机象棋),这是传统象棋的一种变种,棋子的初始位置是随机的。研究旨在利用机器学习技术预测比赛结果,并为每个初始位置开发一个开局主题。本分析的第一部分利用机器学习模型根据每个位置的某些着法预测比赛结果 - 通过可袭近性实现在线预测器的快速再校准
ML 预测模型需要是可靠的和值得信赖的,这通常意味着它们需要输出校准后的概率。本文介绍了一种使用布莱克韦尔可达定理的技术,将可能不具备校准性的在线预测模型转变为校准的预测模型,而原始模型的损失不会显著增加。我们提出的算法在在线环境中实现了比 - 基于电子健康记录的可解释深度学习框架用于预测医院再入院情况
通过利用患者电子健康记录中有用的信息和新颖可解释的深度学习框架,该研究致力于预测意外住院并提高预测结果的解释性,从而减少医院成本和改善患者健康。
- 在在线环境中测量流程结果预测的稳定性
提出了一个用于评估在线预测性流程监控模型稳定性的评估框架,并验证了该框架对不同风险场景下的预测模型比较和选择的有效性。