- 克服选择性分类系统评估中的常见缺陷
选择性分类方法可以在低置信度预测时拒绝,可靠地将基于机器学习的分类系统应用于临床诊断等实际场景。本研究定义了多阈值评估度量在选择性分类中的 5 个要求,涉及任务对齐、可解释性和灵活性,并展示了当前方法未能满足这些要求。我们提出了广义风险覆盖 - EM-GANSim:基于条件生成对抗网络的三维室内场景电磁实时准确模拟
我们提出了一种用于在 3D 室内环境中进行无线通信模拟的实时电磁 (EM) 传播的新型机器学习 (ML) 方法 (EM-GANSim)。我们的方法使用了一种修改后的条件生成对抗网络 (GAN),该网络融合了编码几何和发射机位置,并符合电磁传 - FeNNol:一种高效且灵活的用于构建力场增强神经网络势函数的库
FeNNol 是一个新的库,用于构建、训练和运行增强力场神经网络势能,它提供了一个灵活和模块化的系统,使得能够轻松地将最先进的嵌入与机器学习参数化的物理相互作用项相结合,无需编程,同时利用 Jax Python 库的自动微分和即时编译功能以 - 数字画布的编排:一种艺术表演的机器学习方法
基于属性描述的艺术表演设计工具与新型机器学习模型结合,生成和可视化艺术动作,为艺术家提供直观平台,将复杂运动生成技术普及给更广泛的艺术界。
- 基于机器学习的移动平台研发与性器病理病因的可视判断性能
使用机器学习算法开发了一个用于分类五种阴茎疾病的模型,该模型在验证数据集上表现出色,目前已在全球范围内使用,有潜力改善对阴茎疾病的诊断服务的可及性。
- 人工智能探索专利领域
专利及技术知识管理中的先进语言处理和机器学习技术承诺大规模效率改进。本文系统概述了与专利相关的任务和流行的方法,并着重介绍了发展中和有前景的技术。该研究表明,语言处理和特别是大型语言模型以及最近普遍应用的生成方法有望成为专利领域的颠覆者。然 - 探讨概念漂移检测在水配供网络泄漏检测中的适用性
水分配网络中的泄漏是一项重大风险,会导致水损失和增加污染风险。本文探讨了基于模型损失和基于分布的漂移检测方法在泄漏检测中的潜力,还讨论了数据中的时间依赖问题并提出了解决办法。我们对不同大小和检测时间的泄漏进行了系统评估,此外,我们提出了一种 - 使用深度卷积图像重建的直接系外行星检测(ConStruct):一种用于后处理高对比度图像的新算法
我们提出了一种新颖的机器学习方法,用于检测高对比度自适应光学成像数据中的微弱点源。通过利用深度学习在一种新颖的直接成像后处理算法中,我们的方法旨在改进恒星噪声的近似并提高行星探测灵敏度。我们展示了一个卷积自编码神经网络在广泛的实际成像序列参 - 野生动物数据集:一个用于动物再识别的开源工具包
该研究论文介绍了 WildlifeDatasets 工具集,一个开源工具集用于生态学家和计算机视觉 / 机器学习研究人员,它使用 Python 编写,提供了简单直接获取公开的野生动物数据集的方法,并提供了各种数据集预处理、性能分析和模型优化 - 利用机器学习和本地测量的混合光学湍流模型
构建了一个以机器学习为基础的混合模型框架,通过结合基准宏观气象模型和局部观测数据,提高了每个基准模型的预测能力。该研究表明,在某些情况下,只需很少的观测数据,混合模型和仅使用局部观测数据的模型就能胜过三个基准宏观气象模型的性能。
- 夷为平地:机器学习钓鱼网页检测器上高效的敌对 HTML 攻击
通过黑盒优化算法,我们设计了一种新颖的细粒度修改方式,能够在不损害恶意性和视觉外观的情况下修改输入钓鱼网页的 HTML 代码,从而成功绕过目标检测器,破坏当前最先进的机器学习防钓鱼网页检测系统的性能,仅使用 30 个查询就能击败以前的攻击方 - 电磁侧信道分析的跨 IoT 设备可移植性:挑战与数据集
物联网取证中,设备变异性对机器学习方法的电磁侧信道分析(EM-SCA)的准确性和可靠性有重要影响,并且跨设备可移植性是一个需要解决的挑战。本研究通过实证研究探讨了设备变异性对 EM-SCA 方法的影响,并提出了使用迁移学习解决 EM-SCA - GPT-4 大型预训练语言模型在自动化短答案评分中的表现
自动短答案评分(ASAG)是一个活跃的机器学习研究领域已有十多年的时间。它承诺即使在人工评分师有限的情况下,让教育者对大班课中的自由回答进行评分和反馈。近年来,经过精心训练的模型已经取得了越来越高的性能水平。最近,预训练的大型语言模型(LL - 现代自优化系统的基于集成模型的建模抽象
本文在我们的基于集成的组件模型 DEECo 中扩展了使用机器学习和优化启发式算法来建立和重新配置自主组件集合的能力。我们展示了如何在模型层次上捕捉这些概念,并举例说明这样的模型如何有益地应用于工业 4.0 环境中与访问控制相关的问题。我们认 - 我们应该相信网络抓取的数据吗?
通过网页抓取收集数据的方法存在抽样偏差,本研究指出网页抓取数据存在抽样偏差的三个原因,并通过一系列实例揭示抽样偏差的普遍性和严重性,同时提供了关于如何预测、检测和克服抽样偏差的建议。
- 使用 GPT-4 和基于规则的方法评估多项选择题的质量
本研究采用基于规则和基于 GPT-4 的基于机器学习方法评估了 200 个学生生成的多项选择题目中 19 个常见选项撰写错误。结果显示基于规则的方法可以更准确,更高效地评估多个学科领域的选择题,并在教育使用方面具有潜在校准的作用。
- 利用机器学习方法简化代数多重网格的算子复杂度
提出了一种基于数据驱动和机器学习的方法来计算代数多重网格 (AMG) 方法中的非 Galerkin 粗网格算子,同时保持整体的 AMG 收敛性,以解决操作符复杂度增加的问题。
- 减缓神经网络通信成本:树突非线性的作用
通过机器学习方法,探究了非线性树突对神经网络性能的影响,并发现集成树突结构可以大大提高模型能力和性能,同时有效地控制信号通信成本。
- ExoMDN: 使用混合密度网络快速表征外行星内部结构
利用混合密度网络(MDN)和机器学习建立了 ExoMDN 模型,可以在 1 秒内处理获得行星每个层次的质量分数和厚度的完整后验分布,对小于 25 个地球质量的合成行星进行训练,并用于表征 22 个已确认的系外行星,包括 GJ 1214 b, - 批次稳定高维超参数线性回归中的最小范数风险
本文探讨了使用小批量的阈值学习算法进行分类的好处及最小二乘回归模型的上限风险,同时提出了一个基于特征重叠的小批量版本的最小二乘估计器,它比最小二乘估计器更稳定