关键词image and text embeddings
搜索结果 - 2
- 基于文本引导的病理图像分类模型适应
利用联接图像和文本嵌入(CITE)方法改进病理图像分类,通过注入来自在广泛的生物医学文本中预训练的语言模型所获取的文本见解,使基础模型适应病理图像理解,并在 PatchGastric 胃肿瘤病理图像数据集上取得了领先的性能。
- ECCV通过对比和聚类视觉语言嵌入进行开放世界语义分割
本文提出了一种基于图像文本交互的语义分割模型 ViL-Seg,通过无需密集标注的方式,利用网络上自然存在的图像和文本数据,学习到能够直接分割任意开放世界类别对象的能力,实验结果在三个基准数据集上优于需要数据标注的零样本分割方法。