- 学习可解释的公平表示
利用在表示学习过程中引入可解释的 “先验知识”,我们提出了一个学习可解释公平表达的通用框架,并在 ColorMNIST 和 Dsprite 数据集上进行实验证明,在下游分类任务中,与最先进的公平表达相比,我们的表达不仅可解释,而且准确性稍高 - DistPred:一种无分布的概率推理方法用于回归和预测
DistPred 是一种用于回归和预测任务的新方法,通过使用可微分的离散形式的得分规则,可以在单次前向传递中生成大量样本来估计响应变量的潜在分布,并具有比现有方法更简单且更强大的性能和 90 倍的推理速度。
- 探索音频单元标记化的好处
本文展示了在三项预测任务中使用音素单元和 DAU 分词的优势,包括字素到音素、字素到 DAU 和使用 DAU 语言建模的无监督语音生成,并且证明了分词在性能、训练和推理速度上的显著改进,同时提供了理论解释。
- WeatherFormer:一个基于预训练编码器模型的小数据集天气表示学习方法
本文介绍了 WeatherFormer,一种基于 Transformer 编码器的模型,旨在从少量观测数据中学习稳健的天气特征。它解决了在农业、流行病学和气候科学中许多预测任务中建模复杂天气动态的挑战。WeatherFormer 在大型预训 - DTMamba:时间序列预测的双孪蛇
利用 Mamba 模型对时间序列数据预测任务进行了实验,实验结果表明我们的模型表现良好。
- ICLR一种用于预测任务类别的表示学习游戏
提出了一种基于游戏的形式,用于学习降维表示特征向量,在只有未来预测任务的先验知识可用的情况下。最小化在表示中使用相同损失与使用原始特征的损失之间的预测损失,以展示先验知识的有效性。
- 因果特征的预测因子不能很好地推广到新的领域
研究了机器学习模型在因果特征上训练后在不同领域的泛化能力,发现使用所有可用特征的预测模型在域内和域外的准确性都要优于只使用因果特征的模型,表明在泛化到新领域时,最好的做法是训练包含所有特征的最佳模型。
- 论文:大型语言模型对时间序列分析的启示
当前大语言模型在时间序列分析领域的潜力和发展前景
- 频谱状态空间模型
本文研究具有长距离依赖的预测任务的序列建模,提出了一种基于谱滤波算法学习线性动力系统的状态空间模型的新形式。这一提议产生了一种名为谱状态空间模型的新型序列预测架构,通过对合成动力系统进行评估,支持了谱滤波在需要非常长远记忆的任务中的理论优势 - 具有注意融合的城市区域表示学习
提出了一种名为 HAFusion 的新型模型,通过融合不同区域特征的嵌入来学习区域之间和不同类型区域特征之间的高阶相关性,实现了对城市区域表征的学习, 在三种不同的预测任务中,HAFusion 模型优于现有方法,利用学习得到的区域嵌入可以使 - 关于电子健康记录共享基础模型的适应性的多中心研究
通过将基础模型应用于医疗保健领域,可使人工智能的开发更具规模性和经济效益。医疗记录的结构化基础模型在数百万患者的记录上训练,表现出了较少训练标签的性能提升以及对分布变化的改进鲁棒性。本研究基于多中心数据研究探讨了这种基础模型的适应性,结果显 - 应急护理的多模式临床基准 (MC-BEC):评估紧急医学基础模型的综合基准
提出了应急护理多模态临床基准(MC-BEC),这是一个综合性基准,用于使用 2020-2022 年连续监测的超过 100K 个急诊科访问的数据集评估应急护理中的基础模型。 MC-BEC 关注于分钟到天的时间尺度上的临床相关预测任务,包括预测 - KDD排球分析的图编码和神经网络方法:从比赛结果到个人比赛预测
这项研究旨在提高复杂排球预测的准确性,并为教练和运动员提供更有意义的见解。我们引入了一种专门的图编码技术,将额外的接触 - 接触排球上下文添加到已有的排球数据集中,无需任何额外的数据收集。我们演示了对这个丰富的数据集使用图神经网络(GNNs - 非变量泛化
本文旨在研究 AI 智能代理器对于陌生和新的因变量的预测和探索问题,提出了一种基于先前经验的较为有效的处理方法,并能够实现零样本预测。
- 序数回归的单模分布
提出了两种新的方法,一种是通过新的架构来实现偏好的单峰分布,另一种则通过利用映射的概念来建立新的损失函数,以促进单峰性,实践结果表明新架构获得了最佳性能,并且新损失项在维持高单峰性的同时具有很强的竞争力。
- Few-shot 知识图谱补全中的结构和常识知识调查
本研究通过对少样本知识图谱自动补全任务的学习方法、任务应用、以及未来研究领域的调查和总结,提出了一种使用图形表示学习和少样本学习优势的 FKGC 方法,以期解决常规 KG 和 CKG 补全任务中长尾关系及新关系的问题,并在不同领域的预测任务 - 透过连续粒子滤波在循环神经网络中进行隐状态近似
本文介绍一种基于历史数据,使用逐步加粗的粒子来近似表示潜在状态分布的序列预测模型,利用连续可微分的方案,根据贝叶斯规则,自适应提取有价值的信息和更新潜在状态,并在预测任务中取得了良好的效果。
- 动态图神经网络进行影响力检测
本文研究了在影响者检测中,利用动态图神经网络进行预测任务的不同配置,考虑到网络动态性与时间特征属性的影响,证明使用深度多重注意力和编码时间属性可以显著改善性能,在捕获邻域表示方面比使用网络中心度度量更有益。
- 关于带边特征的图注意力分类阈值
本文分析了图注意力网络及其在节点分类任务中的能力,通过对上下文随机块模型的探究,证明了在噪声情况下使用边特征的图注意力不如简单的图卷积,但当边特征干净时可以较好地区分内部边和外部边,以此优于经典的图卷积。
- Multi-CLS BERT:传统集成的高效替代方案
本文提出了 Multi-CLS BERT 方法,它是一种高效的 BERT 模型集成方法,不需要在测试时运行多个 BERT 模型,只需要运行单个 Multi-CLS BERT 模型。在 GLUE 和 SuperGLUE 数据集上,实验证明这种