BriefGPT.xyz
Ask
alpha
关键词
vision-language pretraining (vlp)
搜索结果 - 1
跨模态医学图像 - 报告检索的掩码对比重建
提出了一种名为蒙版对比与重建(MCR)的高效 VLP 框架,以蒙版数据作为两个任务的唯一输入,增强任务之间的连接,并显著减少所需的 GPU 内存和训练时间。通过映射不同的模态到一个公共特征空间,然后进行局部特征聚合,减少细粒度语义信息的损失
→
PDF
6 months ago
Prev
Next