BriefGPT.xyz
Ask
alpha
关键词
pre-trained language-vision models
搜索结果 - 2
大型视觉语言模型的少样本自适应研究
通过引入适应真实场景需求的新方法,我们综合评估了一个广泛的数据集和场景,发现其在实践中始终优于现有技术,同时作为更高效的替代方案。
PDF
7 months ago
EMNLP
通过知识蒸馏开发多语言和混合编码的视觉问答系统
提出一种基于知识蒸馏方法的英语语言 - 视觉模型拓展到同等效果的多语种和混合编码模型的方法,其使用多个中间层来逐步提取知识,同时在 11 种不同语言设置下创建大规模的多语种和混合编码的 VQA 数据集。
PDF
3 years ago
Prev
Next