Feb, 2023

语言和视觉模型几何形态的融合含义

TL;DR通过对三种不同的预训练语言模型和三种计算机视觉模型进行实证研究,本文发现预训练语言模型具有与计算机视觉模型部分同构的表示收敛能力,其中分散性和多义性对语言和视觉空间的对齐性产生影响 。