Oct, 2023

通过文本解释解读和控制视觉基础模型

TL;DR基于大规模预训练视觉模型,如 CLIP,的本文的研究主要集中在模型的解释和控制,通过理解模型的潜在令牌和进行模型编辑来改进模型的推理行为和鲁棒性。