Oct, 2024

在深度模型合并技术中寻找损失景观的共同点

TL;DR本研究解决了当前神经网络可解释性研究在理解模型训练行为及其任务特定行为方面的显著不足。通过分析模型合并文献并结合损失景观几何学的视角,提供了一种新的分类方法和四个主要方面的特征化,这些发现为提高机器学习的安全性和可信赖性奠定了基础。