- IGANN 稀疏:用非线性洞察力连接稀疏性和可解释性
我们提出了 IGANN 稀疏模型,这是一种广义加性模型的新颖机器学习模型,通过训练过程中的非线性特征选择来促进稀疏性,从而确保在不损失预测性能的情况下提高模型的解释性。
- 走向非对抗性算法修复
在高风险情况下,通过对敌对示例和反事实解释的形式定义,我们介绍了非敌对算法性回应,并阐明了为什么在获得不具备敌对特性的反事实解释方面是至关重要的。我们进一步研究了目标函数中不同组件(例如用于计量距离的机器学习模型或成本函数)如何决定结果是否 - 跨受试者运动想象分类的不确定性量化
不确定性量化旨在确定机器学习模型的预测何时可能错误。计算机视觉研究探索了确定认知不确定性(也称为模型不确定性)的方法,这应该和泛化误差相对应。这些方法在理论上允许根据个体间可变性来预测错误分类。我们应用了各种不确定性量化方法来预测运动想象脑 - MM模型蒸馏理论探索
蒸馏是用一个简化的模型替代复杂的机器学习模型的任务,该论文提出了蒸馏的一般理论,并应用该理论提出了新算法,可以高效地从训练好的神经网络中提取知识,将其蒸馏为简洁明确的决策树表示,并证明了蒸馏相比从头学习更廉价且复杂度有所减少。
- 无人机类型预测:基于采样和数据增强的时间序列分类探索
使用机器学习模型进行无人机的时间序列分类,研究了时序采样方法和类别不平衡修正方法对分类效果的影响,输入为无人机类型,对四旋翼无人机和固定翼无人机的预测准确性较高,而六旋翼无人机容易被误分类。
- 基于聚类敏感性采样的数据高效学习:基础模型与扩展
我们研究数据选择问题,将利用 $k$-means 聚类和敏感性抽样方法,基于模型损失的嵌入表示,可选择一组典型样本,其平均损失与整个数据集的平均损失相对应,具有可证明的性质,并且在微调基础模型上表现优于最先进的方法,同时展示了它如何应用于线 - DeepForge:通过模型预测控制在金属成形中利用人工智能进行微结构控制
本研究介绍了一种结合模型预测控制(MPC)和深度锻造(DeepForge)机器学习模型的封闭模具热锻微结构控制的新方法。DeepForge 利用包含 1D 卷积神经网络和门控循环单元的体系结构,利用工件表面温度测量值作为输入来预测锻造过程中 - KDD客户服务中的接触复杂性
通过开发一种新的机器学习方法来定义联系复杂性,我们训练了一个 AI 专家模型来模拟代理的行为并评估每个联系的复杂性,这种方法基于收集的数据,被证明是可靠、可扩展且划算的。
- ESFL:高效的资源受限异构无线设备下的分割式联邦学习
我们提出了一种高效的分布式联合学习算法(ESFL),通过在服务器和终端设备之间将模型分割为不同的子模型,综合考虑用户异构性,同时优化用户端工作量和服务器端计算资源分配,以充分利用中央服务器的强大计算能力。与标准的联合学习、分割学习和分割联合 - DualView: 双重视角的数据归属
本研究介绍了一种基于替代建模的后续数据归因方法 DualView,它在计算效率和评估结果方面表现良好。通过使用适合的定量评估策略和相关的局部数据归因方法,我们发现 DualView 方法在需要较低计算资源的同时,表现不亚于其他方法。此外,该 - 利用机器学习预测太阳活动区的出现
利用声压密度变化的机器学习模型,可以在太阳表面的特定区域提前 5 小时预测连续强度是否会减小,这将有助于创建对未来太空天气干扰的早期预警能力。
- 基于地形 GPS 记录的聚类动态优化速度预测
使用稀疏 GPS 数据点及其相关的地形和道路设计特征,我们在缺乏交通数据的区域提出了一个解决方案来预测速度。通过创建一个基于地形聚类道路的以时间为导向的速度字典,我们展示了对新的和标准回归方法的定性和定量改进。这个框架为缺失数据交通分析提供 - 优化参数和神经元修剪用于外样本检测
我们提出了一种名为 OPNP 的优化参数和神经元修剪方法,用于无需训练的离群样本检测,通过评估模型的参数和神经元敏感度,并移除导致过拟合的参数和神经元,从而实现了对未知样本的检测,并在多个离群样本检测任务和模型结构上取得了显著的性能优势。
- 利用遥感数据进行空气污染评估
使用机器学习模型,特别是随机森林模型,在 2019 年对伊比利亚半岛的五种选择性污染物进行了浓度预测,并使用卫星测量、气象变量、土地利用分类、时间变量和空间变量作为模型特征进行评估。
- 使用野外加速度计数据推测言语意图
通过加速度计数据,研究推断 AI 对说话意图的成功与失败,并采用机器学习模型从真实社交网络事件的数据中进行训练和评估,结果表明加速度数据中存在有用的信息,但尚不足以可靠地捕捉到说话的意图。
- MM提供模型作为一项服务的联邦学习:联合训练与推断优化
通过联邦学习对模型训练和推理进行联合优化,以最大化客户端的推理性能。
- 利用多源新闻摘要塑造政治话语
多文档摘要是自动生成与同一主题相关的多个文档的简洁摘要的过程。本文提出了一个机器学习模型,从多个新闻文档中生成主题的简洁摘要,并设计成能够公正地从各个方面均等采样输入信息,即使大多数新闻来源倾向于一方。
- BIRB:生物声学信息检索的泛化度量基准
应对训练和部署条件的差异(例如分布偏移或对全新类别的泛化)对于机器学习模型在实际应用中至关重要。本研究提出了一个复杂的基准测试集 BIRB,以检索从大型公众科学语料库中经过被动记录的数据集中的鸟类声音。通过使用表示学习和最近质心搜索的基线系 - 基于数据驱动的公共电动汽车充电基础设施改进框架:建模与预测
开发一种基于 QoE 指标的评估框架,通过机器学习模型和数据集预测未来长期的电动汽车充电需求,以实现可靠的可持续充电基础设施扩展。
- (可证明的)群等变任务中的对抗鲁棒性:图形,点云,分子等
机器学习模型的稳健性不仅需要考虑输入微扰对其预测的影响,还要考虑任务的等变性。本研究首次提出了适用于等变性任务的对抗稳健性概念,并证明了通过选择符合任务等变性的模型和进行传统的对抗稳健性认证可以实现可证稳健性。此外,本研究还通过等变性保持随