May, 2024

关于羊驼起源的模型树遗传恢复

TL;DR神经网络模型的快速增长使模型权重成为重要的数据形式。我们通过定义模型树描述模型的起源来解决网络上公开的模型数据无法解释和组织的问题。我们介绍了模型树继承恢复任务,旨在根据模型权重解码模型的树结构,从而有助于模型的作者鉴定和互联网索引等应用。通过对权重的分布特性进行分类,我们能够确定两个模型之间的关系和关系的方向。MoTHer 恢复将模型层次结构表示为一个有向树,成功地重建了复杂的模型树和 “野外” 模型族群的结构,如 Llama 2 和稳定扩散。