BriefGPT.xyz
Ask
alpha
关键词
vision-language relation alignment
搜索结果 - 1
视觉语境下的语义组合模型
本文探讨了视觉图像和语言语义的组合结构问题,并提出了一些方法,如 WinogroundVQA, Syntactic Neural Module Distillation, Causal Tracing for Image Captionin
→
PDF
a year ago
Prev
Next