transforming input images | BriefGPT

关键词transforming input images

搜索结果 - 1

基于 CLIP 的图像到文本转换提升多模态理解能力
将输入图像转化为相应的文字解释是计算机视觉和自然语言处理领域中一个关键而复杂的过程，本文提出了一种创新的集成方法，利用对比式语言图像预训练模型的能力。
PDF6 months ago