BriefGPT.xyz
大模型
Ask
alpha
关键词
quasi-textual feature transformer
搜索结果 - 1
根据要求进行设计:利用视觉问答进行多模态预训练
我们利用多模态预训练中的视觉问题回答(VQA)指导框架,聚焦目标病理特征,通过医学报告中的描述设计了关联不同疾病的多粒度问题 - 答案对,并提出了一种基于准文本特征变换的新型预训练框架,将视觉特征转化为接近文本领域的准文本空间,缩小了视觉
→
PDF
3 months ago
Prev
Next