机器学习的分析层次
本文讨论了将深度学习与科学相结合以解决机器学习系统中的严谨性、安全性和可解释性的问题,并提出了关键缺失的假设和测试阶段以及统计和系统不确定性估计。同时,探讨了当前科学在其他领域中的应用,为机器学习研究人员提供了一些有用的实践建议。
Apr, 2019
我们引入了生态系统级别的分析,发现机器学习在部署过程中容易发生系统故障,即所有可用模型都无法正确分类一些用户,在医学图像方面,机器学习模型预测中的种族差异不同于人类预测,在表征机器学习的社会影响方面,生态系统级别的分析具有独特的优势。
Jul, 2023
机器学习研究领域近年来取得巨大进展,深度学习模型在各种任务上表现出色。然而,这些模型往往在可解释性方面存在不足,因为它们作为不透明的 “黑盒子” 运行,使其决策背后的原理被遮蔽。为了解决这一挑战,我们的研究团队提出了一个创新框架,旨在权衡模型性能和可解释性之间的折衷。我们的方法以对高维数据的模块化操作为核心,可以进行端到端处理同时保持可解释性。通过融合多样化的解释技术和模块化数据处理,我们的框架可以揭示复杂模型的决策过程,而不损害其性能。我们广泛测试了我们的框架,并验证了其在实现计算效率和可解释性之间取得协调平衡方面的卓越成效。我们的方法通过在各个领域的部署中提供前所未有的对复杂模型内部工作原理的洞察,促进信任、透明度和问责制,满足当代机器学习应用的关键需求。
Jan, 2024
本文综述了近年来人工神经网络和机器学习领域所取得的进展和对于成功和微妙性的理解,通过数值实验和简化模型的分析,以及严谨的数学结果,讨论对于这个快速发展领域最重要的开放性问题。
Sep, 2020
这篇综述旨在推广对自动化 / 自主机器学习系统的更广阔视角,并探讨整合各种机制和理论框架的最佳方式。主要介绍超参数优化、多组件模型、神经架构搜索、自动特征工程、元学习、多层集成、动态自适应、多目标评估、资源限制、灵活的用户参与和泛化原则的发展。最终得出结论,建立自动化机器学习系统的架构整合是一个值得更深入探讨的重要问题。
Dec, 2020
本文提出了一种新颖的信息论框架,用其自己的遗憾和样本复杂度分析机器学习的数据需求,并用该框架研究了由具有 ReLU 激活单元的深度神经网络生成的数据的样本复杂度,并在权重的特定先验分布下建立了同时独立于宽度和线性深度的样本复杂度界限。
Mar, 2022
机器学习在系统理论的视角下对在线学习的建模存在不完善之处,本文提出了一种基于系统设计的在线学习框架,包括在线学习的新定义和关键设计参数的识别,以及系统结构和系统行为的划分。同时,通过以医疗保健提供者欺诈检测为案例研究,将讨论与实际在线学习挑战相结合。
Apr, 2024
本综述论文介绍了自然语言处理领域中使用神经网络模型替代传统系统的进展情况及其分析方法,并根据主要研究趋势进行分类,指出现有限制,并提出未来工作的潜在方向。
Dec, 2018