BriefGPT.xyz
Ask
alpha
关键词
lxmert
搜索结果 - 4
MM
LXMERT 模型压缩用于视觉问答
本研究通过结合 LXMERT 模型的特点和可训练子网络的观察,评估在 VQA 任务上微调的 LXMERT 模型中是否存在可独立进行训练的子网络,并通过对模型大小利益分析,探究在不显著降低准确度的情况下可以进行多少程度的模型剪枝。实验结果表明
→
PDF
8 months ago
ACL
探究位置信息在视觉语言模型中的作用
研究了视觉语言模型中的位置信息对图像 - 文本匹配任务的影响,并提出了两种解决策略,即位置信息预训练和基于交叉模态匹配的对比学习。结果显示,即使位置信息存在,模型仍不能正确地分类具有详细位置语句的图像。
PDF
a year ago
视觉问答中语言模态的实证研究
本文通过一系列实验,探究语言模态对视觉问答模型在超出其学习领域的数据上的影响,提出简单的方法来减少模型对语言先验的依赖并在 out-of-distribution 测试集上提高性能。
PDF
a year ago
EMNLP
X-LXMERT: 使用多模态转换器进行绘画、字幕和回答问题
本文研究了图像生成模型中的视觉语言模型(V&L 模型)LXMERT,发现其效果不如其他图像生成模型,因此提出了 X-LXMERT 模型,通过训练优化使其生成图像的能力媲美最先进的生成模型,同时保持了它在问答和字幕生成任务上的优秀表现,并证明
→
PDF
4 years ago
Prev
Next