通过提出广义函数线性模型作为一个可解释的替代模型,可以在科学机器学习中获得可比较的准确性并提高超出分布数据的泛化能力,同时提供更多的透明度和可解释性。
Jul, 2023
该论文介绍了元学习的概念及其在通信系统中的应用,其中,元学习可以通过选择合适的归纳偏置,将训练过程中需要的数据和时间复杂度降至最小。
Jan, 2020
本文提出了使用神经网络对力学系统的 Lagrangian 以及作用在该系统上的广义力进行建模的方法,说明该方法优于黑匣子模型的数据效率和模型强化学习性能,并进行了系统研究以验证该方法融入先前知识提高了其数据效率。
Feb, 2019
本文研究了通过 Meta-learning 或者说 Learning-to-learn 的方式来训练黑盒子模型成为通用的上下文学习算法,同时发现相比于标准模型,黑盒子模型训练时的瓶颈不是参数数量而是可以访问的状态大小。此外,本文提出了一些实际操作手段,如改变训练集分布来改善通用学习算法的 Meta-training 和 Meta-generalization。
Dec, 2022
机器学习研究领域近年来取得巨大进展,深度学习模型在各种任务上表现出色。然而,这些模型往往在可解释性方面存在不足,因为它们作为不透明的 “黑盒子” 运行,使其决策背后的原理被遮蔽。为了解决这一挑战,我们的研究团队提出了一个创新框架,旨在权衡模型性能和可解释性之间的折衷。我们的方法以对高维数据的模块化操作为核心,可以进行端到端处理同时保持可解释性。通过融合多样化的解释技术和模块化数据处理,我们的框架可以揭示复杂模型的决策过程,而不损害其性能。我们广泛测试了我们的框架,并验证了其在实现计算效率和可解释性之间取得协调平衡方面的卓越成效。我们的方法通过在各个领域的部署中提供前所未有的对复杂模型内部工作原理的洞察,促进信任、透明度和问责制,满足当代机器学习应用的关键需求。
Jan, 2024
本论文研究了多任务学习(MTL)与基于梯度的元学习(GBML)之间的关系,通过理论和实证研究证明了它们在优化公式和学习到的预测函数上的相似性,并通过样例展示了 MTL 作为一阶方法可以代替计算代价高的二阶方法 ——GBML,在大规模数据集上训练时更加有效。
Jun, 2021
本论文通过应用无序系统的统计物理学技术,对解决使用 softmax 输出和交叉熵损失的分类任务的深度神经网络的推广进行非线性动力学的分析,以理论上支持多任务学习表现由任务的噪声性以及输入特征对其的对齐程度来决定的直觉。
Oct, 2019
这篇论文介绍了元学习的概念和原理,并阐述了元学习与传统学习和联合学习的比较。在讨论主要的元学习算法和元学习技术的定义的通用双层优化框架之后,提出了几个元学习的应用。此外还介绍了与新兴计算技术,即神经形态计算和量子计算相关的元学习一些方面。
Oct, 2022
本研究提出了一个基于机器学习的数据生成框架,旨在辅助那些利用模拟来研究各种物理系统或过程的研究人员。我们的方法包括两个步骤:首先,我们使用有限的模拟数据训练监督预测模型来预测模拟结果;然后,我们使用强化学习代理来生成准确的、类似于模拟的数据,从而更有效地探索参数空间并深入了解物理系统或过程。我们通过两个案例研究:一个关注地震破裂物理,另一个关注新材料开发,证明了所提出框架的有效性。
May, 2023
通过利用物理学中的能量景观方法,在机器学习模型中识别有意义的特征来解释模型决策,为使机器学习在医学、网络安全、自动驾驶等领域得到广泛采用提供了一种新途径。
Apr, 2023