BriefGPT.xyz
Ask
alpha
关键词
large-scale image-text pair dataset
搜索结果 - 1
CXR-CLIP:大规模胸部 X 光照片语言 - 图像预训练
本文研究了利用大规模图像 - 文本配对数据集进行视觉语言预训练模型的发展,解决医疗领域中缺乏数据的问题,并通过扩展图像 - 标签对为图像 - 文本对,利用多个图像和多个部分的放射学报告来提高模型性能。同时设计了两个对比损失,ICL 和 TC
→
PDF
9 months ago
Prev
Next