Sep, 2023

C-CLIP:用于缩小描述性文字之间差距的对比图像 - 文本编码器

TL;DR通过训练对比图像 - 文本编码器,利用明确的评论式对提高检索结果的准确性进行了大幅改进,并且这种改进可扩展至多种非英语语言。