- ICML学习发散场以获得偏移鲁棒的图表示
我们提出了一个可学习的发散场几何扩散模型来解决依赖关系数据的挑战性泛化问题。通过引入随机扩散性来广义扩散方程,旨在捕捉依赖关系数据之间的多方面信息流动。另外,通过因果推断导出了一种新的学习目标,可指导模型学习对不同领域中都无关的依赖关系模式 - SUMIE: 增量实体摘要的合成基准
SUMIE 是一个完全合成的数据集,用于暴露现实世界的增量实体摘要挑战,验证了生成的摘要与段落之间的高质量一致性,该数据集难度高,先进的语言模型在更新摘要时的 F1 得分超过 80.4%。
- ACLHelloFresh: 在 X 社群笔记和维基百科编辑流中对真实世界人类编辑行为的 LLM 评估
设计 LLM 基准测试是具有挑战性的,HelloFresh 是一种基于实时数据生成的基准测试方法,可以解决测试数据污染和过拟合问题,并通过不断地生成新的评估数据来实现持续评估。
- SMCL:用于长尾识别的显著性掩蔽对比学习
本文提出了一种新的方法,利用显著性遮罩和对比学习来减轻训练不平衡数据的问题并提高模型的泛化能力,在特征空间中将遮罩图像移向次要类别,以减少与原始类别相关的背景特征。实验证明,我们的方法在基准长尾数据集上获得了最先进的性能水平。
- 数理推理中的离群检测的轨迹波动
提出了一种基于轨迹的方法 TV score,通过使用轨迹的波动性进行数学推理中的离群数据检测,实验证明该方法在数学推理场景下优于传统算法,并可扩展到输出空间具有高密度特征的更多应用,如多项选择题。
- 面向数据驱动的自动驾驶虚拟测试的联合方法:AVEAS 项目
该研究介绍了德国 AVEAS 研究项目的中间结果,该项目旨在开发用于高级驾驶辅助系统和自动驾驶的虚拟验证和验证的真实世界数据的方法和度量,并建立遵循 FAIR 原则的在线数据库。
- 神经网络学习用于期权定价的 Black-Scholes 方程
基于神经网络的方法可以解决实际股票期权时间序列的 Black-Scholes 方程,实验结果表明,与传统的 Black-Scholes 解析解相比,基于神经网络的期权定价方法的预测更准确,可用于短期期权市场中的期权定价预测。
- 大型语言模型的检索增强文本生成综述
Retrieval-Augmented Generation (RAG) 是一种合并检索方法和深度学习技术的方法,旨在通过动态整合最新的外部信息解决大型语言模型(LLMs)的静态限制,并通过使用真实世界的数据提供一种成本效益的解决方案来改进 - 游戏与参考:疫情防控政策组合综合
我们提出了一种新颖的疫情政策制定模型,采用对抗学习和对比学习的方法,以确保模型始终学习到有用的信息,并在真实世界数据上进行了广泛的实验证明了该模型的有效性。
- 利用电子健康记录的流行病学问题回答中的检索辅助文本转 SQL 生成
引入一种基于文本到 SQL 生成和检索增强生成(RAG)的端到端方法,利用电子健康记录和索赔数据回答流行病学问题,研究表明该方法显著提高了性能,对提高语言模型能力有应用前景。
- 通过模拟对实际现实进行调和:一种用于强大操纵的实际到模拟到实际的方法
通过模拟环境构建数字双子,提出了一种通过强化学习来增强真实世界模仿学习策略的系统 RialTo,实现高性能、鲁棒性的策略的学习,同时避免大量不安全的真实数据收集和大量人工监督。
- 统计学习中的确定性和近似确定性模型
本文提出了一种统一的方法,以验证数据插补对于学习准确模型是否必要,并在插补不必要的情况下返回准确模型。通过我们的算法,可以显著减少数据插补所需的时间和工作量,并且不会带来明显的计算负担。
- 基于上下文的驾驶员分心定量风险评估机器学习模型
驾驶行为相关事故的避险技术对于风险缓解至关重要。我们提供了一种新的多类驾驶员分心风险评估(MDDRA)模型,该模型在旅程中考虑了车辆、驾驶员和环境数据。MDDRA 通过风险矩阵将驾驶员分类为安全、不小心或危险。我们使用 Field Oper - 多视角符号回归
多视图符号回归(MvSR)方法考虑多个同时存在的数据集,以模拟实验环境并输出一个通用参数解,可以准确拟合所有数据集,能够恢复已知表达式并找到有前景的替代方案,从而使符号回归方法在广泛的实验场景下可用。
- SCANIA 零件 X 数据集:一个用于预测性维护的实际多变量时间序列数据集
本文介绍了一篇关于来自 SCANIA,瑞典一批卡车的一个匿名化引擎组件(称为 X 组件)的实际多变量时间序列数据集的描述。这个数据集包括捕获详细操作数据、维修记录和卡车规格的多种变量,通过匿名化保持机密性。该数据集非常适合于各种机器学习应用 - 基于几何先验引导的长尾分类特征表示学习
利用特征分布的几何信息来引导模型学习尾类的潜在分布,并且通过特征不确定性建模以提高模型在测试领域中的泛化性能。
- 基于强化学习的离散时间均值方差策略
本文基于强化学习研究了一个基于离散时间的均值方差模型,与其在连续时间中的对应物相比,离散时间模型对资产收益分布作出了更一般的假设。使用熵来衡量探索成本,我们得出了最优投资策略,其密度函数也是高斯型的。另外,我们设计了相应的强化学习算法。模拟 - 半监督学习能否有效利用全部数据?从下界的角度看
半监督学习算法可以利用未标记数据,改善有监督学习算法的样本复杂性。然而,现有的理论分析主要关注无监督学习能够使用足够的未标记数据来学习良好的决策边界的情况。我们通过对二元高斯混合模型的严格下界进行推导,在分布的标记和未标记数据集大小以及混合 - 使用合成的基于视频的数据训练鲁棒的深度生理测量模型
本文提出了在合成生理信号和相应的面部视频中添加真实世界噪声的几种方法,并在三个公开的真实世界数据集上评估了我们的框架,结果显示我们能够将平均 MAE 从 6.9 降低到 2.0。
- 长尾学习作为多目标优化
通过多目标优化,我们提出一种梯度平衡聚类(GBG)策略,以应对现实世界数据中的类别不平衡和长尾分布问题,并在长尾学习中展现出比现有方法更优越的性能。