lxmert | BriefGPT - AI 论文速递

关键词lxmert

搜索结果 - 4

MMLXMERT 模型压缩用于视觉问答
本研究通过结合 LXMERT 模型的特点和可训练子网络的观察，评估在 VQA 任务上微调的 LXMERT 模型中是否存在可独立进行训练的子网络，并通过对模型大小利益分析，探究在不显著降低准确度的情况下可以进行多少程度的模型剪枝。实验结果表明
PDF8 months ago
ACL探究位置信息在视觉语言模型中的作用
研究了视觉语言模型中的位置信息对图像 - 文本匹配任务的影响，并提出了两种解决策略，即位置信息预训练和基于交叉模态匹配的对比学习。结果显示，即使位置信息存在，模型仍不能正确地分类具有详细位置语句的图像。
PDFa year ago
视觉问答中语言模态的实证研究
本文通过一系列实验，探究语言模态对视觉问答模型在超出其学习领域的数据上的影响，提出简单的方法来减少模型对语言先验的依赖并在 out-of-distribution 测试集上提高性能。
PDFa year ago
EMNLPX-LXMERT: 使用多模态转换器进行绘画、字幕和回答问题
本文研究了图像生成模型中的视觉语言模型（V&L 模型）LXMERT，发现其效果不如其他图像生成模型，因此提出了 X-LXMERT 模型，通过训练优化使其生成图像的能力媲美最先进的生成模型，同时保持了它在问答和字幕生成任务上的优秀表现，并证明
PDF4 years ago