Nov, 2023
将视觉分类表示为单词的线性组合
Representing visual classification as a linear combination of words
Shobhit Agarwal, Yevgeniy R. Semenov, William Lotter
TL;DR利用视觉 - 语言模型识别视觉分类任务中的基于语言的描述器,通过在图像和文本之间的预训练联合嵌入空间进行线性组合,得出每个单词与基于视觉的分类器的关联度权重,从而使非专家人员能够以非平凡水平完成专业医学任务。