Jun, 2023

Rosetta 神经元:在模型库中挖掘公共基元

TL;DR本篇论文旨在探究在不同任务、架构和不同监督方式(包括有标签和无标签)的神经网络中,是否存在一些相同的表征。研究发现,通过挖掘 Rosetta Neurons 字典,可以发现在不同的视觉模型中都存在一些通用的视觉概念和结构,这些 Rosetta Neurons 可以实现模型之间的翻译并且进行跨类别的对齐、平移、缩放等操作,而不需要特殊训练。