BriefGPT.xyz
Ask
alpha
关键词
multi-modal downstream tasks
搜索结果 - 1
LG-VQ:语言导向的代码本学习
本文提出了一种新颖的语言引导的码书学习框架 (LG-VQ),旨在学习与文本对齐的码书,以提高多模态下游任务的性能。实验结果表明,我们的方法在重构和各种多模态下游任务上取得了优越的性能。
PDF
a month ago
Prev
Next