Jul, 2023

实质还是风格:你的图像嵌入知道什么?

TL;DR通过对多种视觉 embedding 进行系统转换任务的测试与比较,发现不同的网络预训练算法会在 embedding 中编码不同类型的图像非语义信息,并且这些信息可以被有效地利用到一些特定的下游应用中。